AyaVision–Cohere推出多模态、多语言的视觉模型
AI工具百科:
Aya Vision是什么
Aya Vision 是 Cohere 推出的多模态、多语言...
OpenVision–加州大学开源的视觉编码器家族
AI工具百科:
OpenVision是什么
OpenVision是加州大学圣克鲁兹分校(UCSC)...
QLIP–英伟达推出的视觉标记化方法
AI工具百科:
QLIP是什么
QLIP(Quantized LanguageImage Pretraining)是英...
ChanceAI–AI视觉搜索引擎,一键获取产品的深度信息
AI工具百科:
Chance AI是什么
Chance AI 是AI视觉搜索引擎,基于视觉智能帮...
GPDiT–清华北大联合阶跃星辰等推出的视频生成模型
AI工具百科:
GPDiT是什么
GPDiT(Generative Pretrained Autoregressive Di...
StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推...
Seed1.5VL–字节跳动Seed推出的视觉语言多模态大模型
AI工具百科:
Seed1.5VL是什么
Seed1.5VL 是字节跳动 Seed 团队最新发布的视...
DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架
AI工具百科:
DanceGRPO是什么
DanceGRPO 是字节跳动 Seed 和香港大学联合推...
NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新...

