NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新...
WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型
AI工具百科:
WebSSL是什么
WebSSL(Webscale SelfSupervised Learning)是M...
VideoT1–清华联合腾讯推出的视频生成技术
AI工具百科:
VideoT1是什么
VideoT1 是清华大学和腾讯的研究人员共同推出的...
FastVLM–苹果推出的高效视觉语言模型
AI工具百科:
FastVLM是什么
FastVLM是苹果推出的高效的视觉语言模型(VLM)...

