DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架
AI工具百科:
DanceGRPO是什么
DanceGRPO 是字节跳动 Seed 和香港大学联合推...
StarVector–开源多模态视觉语言模型,支持图像和文本到SVG生成
AI工具百科:
StarVector是什么
StarVector 是开源的多模态视觉语言模型,Se...
StepVideoTI2V–阶跃星辰开源的图生视频模型
AI工具百科:
StepVideoTI2V是什么
StepVideoTI2V 是阶跃星辰(StepFun)推...
ViduQ1–生数科技推出的高可控视频大模型
AI工具百科:
Vidu Q1是什么
Vidu Q1 是清华大学人工智能研究院副院长、生数...
NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙...
XDancer–字节等机构推出音乐驱动的人像舞蹈视频生成框架
AI工具百科:
XDancer是什么
XDancer 是字节跳动联合加州大学圣地亚哥分校和...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新...
VisionStory–AI视频生成工具,支持视频中角色的情感控制
AI工具百科:
VisionStory是什么
VisionStory是创新的AI视频生成工具,能将...
WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型
AI工具百科:
WebSSL是什么
WebSSL(Webscale SelfSupervised Learning)是M...
VideoT1–清华联合腾讯推出的视频生成技术
AI工具百科:
VideoT1是什么
VideoT1 是清华大学和腾讯的研究人员共同推出的...
PikaTwists–PikaLabs推出的AI视频编辑功能
AI工具百科:
Pika Twists是什么
Pika Twists 是 Pika Labs 推出的 AI 视频...
PolloAI–新加坡HIX.AI推出的多模态AI视频生成平台
AI工具百科:
Pollo AI是什么
Pollo AI 是新加坡公司 HIX.AI 开发的多模态人...