VITAAudio–开源的端到端多模态语音大模型,低延迟、推理快
AI工具百科:
VITAAudio是什么
VITAAudio 是开源的端到端多模态语音大模型,...
OThinkMR1–OPPO联合港科大推出的多模态语言模型优化框架
AI工具百科:
OThinkMR1是什么
OThinkMR1是OPPO研究院和香港科技大学(广州...
明岐–上海交大推出的医学多模态大模型,精准诊断罕见病
AI工具百科:
明岐是什么
明岐是上海交通大学计算机学院LoCCS实验室推出的首...
MotionAnything–腾讯联合京东等高校推出的多模态运动生成框架
AI工具百科:
Motion Anything是什么
Motion Anything 是澳大利亚国立大学、...