GPDiT–清华北大联合阶跃星辰等推出的视频生成模型
AI工具百科:
GPDiT是什么
GPDiT(Generative Pretrained Autoregressive Di...
StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推...
Eagle2.5–英伟达推出的视觉语言模型
AI工具百科:
Eagle 2.5是什么
Eagle 2.5是英伟达推出的视觉语言模型,专注...
PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型
AI工具百科:
Pixel Reasoner是什么
Pixel Reasoner是滑铁卢大学、香港科技...
NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙...
VeoGoAI–AI短视频预测工具,提供流量预测和优化建议
AI工具百科:
VeoGo AI是什么
VeoGo AI 是面向短视频创作者的智能预测工具,...
OpusSearch–OpusClip推出的AI视频搜索工具
AI工具百科:
OpusSearch是什么
OpusSearch 是 OpusClip 推出的 AI 视频搜索...
KuaiMod–快手推出的自动化短视频质量判别框架
AI工具百科:
KuaiMod是什么
KuaiMod 是快手推出的基于多模态大模型的短视频...
OpenVision–加州大学开源的视觉编码器家族
AI工具百科:
OpenVision是什么
OpenVision是加州大学圣克鲁兹分校(UCSC)...
ProxyLite–开源视觉语言模型,支持自动化网页任务
AI工具百科:
Proxy Lite是什么
Proxy Lite 是开源的轻量级视觉语言模型(VL...
AVD2–清华联合复旦等机构推出的自动驾驶事故视频理解与生成框架
AI工具百科:
AVD2是什么
AVD2(Accident Video Diffusion for Accident Vid...
QLIP–英伟达推出的视觉标记化方法
AI工具百科:
QLIP是什么
QLIP(Quantized LanguageImage Pretraining)是英...
- 1
- 2

