StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推...
Eagle2.5–英伟达推出的视觉语言模型
AI工具百科:
Eagle 2.5是什么
Eagle 2.5是英伟达推出的视觉语言模型,专注...
OpenLLMVTuber–AI数字人语音交互项目,支持实时语音对话和视觉感知
AI工具百科:
OpenLLMVTuber是什么
OpenLLMVTuber 是开源的跨平台语音交互 A...
Seed1.5VL–字节跳动Seed推出的视觉语言多模态大模型
AI工具百科:
Seed1.5VL是什么
Seed1.5VL 是字节跳动 Seed 团队最新发布的视...
Pinch–AI翻译平台,支持30多种语言在视频通话中即时语音翻译
AI工具百科:
Pinch是什么
Pinch 是创新的实时 AI 语音翻译视频会议平台,专...
PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型
AI工具百科:
Pixel Reasoner是什么
Pixel Reasoner是滑铁卢大学、香港科技...
DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架
AI工具百科:
DanceGRPO是什么
DanceGRPO 是字节跳动 Seed 和香港大学联合推...
StarVector–开源多模态视觉语言模型,支持图像和文本到SVG生成
AI工具百科:
StarVector是什么
StarVector 是开源的多模态视觉语言模型,Se...
ViduQ1–生数科技推出的高可控视频大模型
AI工具百科:
Vidu Q1是什么
Vidu Q1 是清华大学人工智能研究院副院长、生数...
NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新...
VisionStory–AI视频生成工具,支持视频中角色的情感控制
AI工具百科:
VisionStory是什么
VisionStory是创新的AI视频生成工具,能将...

