NotaGen–中央音乐学院联合北航、清华等推出的音乐生成模型
AI工具百科:
NotaGen是什么
NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱。NotaGen ...
UniToken–复旦联合美团等机构推出的统一视觉编码框架
AI工具百科:
UniToken是什么
UniToken 是新型的自回归生成模型,专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示,构建了一种统一的视觉编码框架,能同时捕捉图像的高级...
LaWGPT–南京大学推出的中文法律大语言模型
AI工具百科:
LaWGPT是什么
LaWGPT 是南京大学推出的中文法律大语言模型,基于 LLaMA 模型进行二次预训练,融入大量中文法律知识。专注于法律领域,能理解和生成与法律相关的文本,适...
MoCha–Meta联合滑铁卢大学推出的端到端对话角色视频生成模型
AI工具百科:
MoCha是什么
MoCha AI 是 Meta 和滑铁卢大学联合开发的端到端对话角色视频生成模型。能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。
MoCha 采用语...
BuzzClip–AI视频生成平台,60秒内生成有传播潜力的短视频
AI工具百科:
BuzzClip是什么
BuzzClip 是人工智能驱动的视频生成平台,专为快速创作TikTok内容而设计。能在60秒内生成具有病毒传播潜力的短视频,帮助用户高效地在TikTok上吸引关注。...
SteamerI2V–百度推出的图像到视频生成模型
AI工具百科:
SteamerI2V是什么
SteamerI2V 是百度 Steamer 团队推出的图像到视频生成模型,通过将静态图像转化为动态视频,展现出卓越的视觉生成能力。模型在 VBench 国际权威的视频...
HunyuanCustom–腾讯混元开源的多模态定制视频生成框架
AI工具百科:
HunyuanCustom是什么
HunyuanCustom是腾讯混元团队推出的多模态驱动的定制化视频生成框架。HunyuanCustom支持图像、音频、视频和文本等多种输入条件,支持生成具有特定主...
BeingM0–北大联合人民大学推出的人形机器人通用动作生成模型
AI工具百科:
BeingM0是什么
BeingM0 是北京大学、中国人民大学等机构联合推出的首个大规模人形机器人通用动作生成模型。BeingM0 基于业界首个百万级动作数据集 MotionLib,用创新的 M...
DICETalk–复旦联合腾讯优图推出的情感化动态肖像生成框架
AI工具百科:
DICETalk是什么
DICETalk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架,支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICETalk引入情感...
MiniMaxMCPServer–MiniMax推出基于MCP的多模态生成服务器
AI工具百科:
MiniMax MCP Server是什么
MiniMax MCP Server 是 MiniMax 稀宇科技推出的基于模型上下文协议(MCP)的多模态生成服务器。通过简单的文本输入,可调用视频生成、图像生成...
3DTown–哥伦比亚联合CybeverAI等推出单视图生成3D城镇场景的框架
AI工具百科:
3DTown是什么
3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输入图像分解为重叠区域...
ZenCtrl–FotographerAI推出的商品图生成AI工具
AI工具百科:
ZenCtrl是什么
ZenCtrl 是 Fotographer AI 推出的 AI 图像生成工具,支持从单张图像生成高质量、多视角和多样化场景的图像,无需额外训练数据。
基于先进算法和图像处...