AI新工具

blog-thum
VILA

英伟达发布的模型,通过大规模的图像-文本数据进行预训练,从而实现视频理解和多图像理解能力。

read more