A2E–一站式AI数字人形象创作平台
AI工具百科:
A2E是什么
A2E 是一站式AI创作平台,通过先进的神经网络和计算机视觉技术,使用户能轻松创建逼真的数字人视频。为开发者提供最经济、最便捷、最灵活的 AI 数字人形象解决...
OmniTalker–阿里推出的实时文本驱动说话头像生成框架
AI工具百科:
OmniTalker是什么
OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音响应。
核...
LemonSliceLive–LemonSlice推出的实时视频聊天AI工具
AI工具百科:
Lemon Slice Live是什么
Lemon Slice Live 是 Lemon Slice 公司推出的实时视频聊天工具,基于先进的扩散变换器模型(DiT),能将任何照片或插画转换为可以实时互动的动画角...
Lipsync2–SyncLabs推出的首个零shot嘴型同步模型
AI工具百科:
Lipsync2是什么
Lipsync2 是 Sync Labs 推出的全球首个零shot 嘴型同步模型。无需针对特定演讲者进行预训练,能即时学习并生成符合独特说话风格的嘴型同步效果。
模型...
HRAvatar–清华联合IDEA推出的单目视频生成3D头像技术
AI工具百科:
HRAvatar是什么
HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术,支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术...
FantasyTalking–阿里联合北邮推出静态肖像生成可控数字人的框架
AI工具百科:
FantasyTalking是什么
FantasyTalking 是阿里巴巴 AMAP 团队和北京邮电大学联合提出的新型框架,用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变...
Heygem–硅基智能推出的开源数字人模型
AI工具百科:
Heygem是什么
Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成数字人形象和声音克隆,...
Character3–Hedra推出的全模态AI数字人视频生成模型
AI工具百科:
Character3是什么
Character3 是 Hedra Studio 推出的全模态 AI 数字人视频生成模型,能同时处理图像、文本和音频输入,通过联合推理生成高质量的视频。
支持全身动作...
OpenAvatarChat–阿里开源的实时数字人对话系统
AI工具百科:
Open Avatar Chat是什么
Open Avatar Chat 是阿里开源的模块化的实时数字人对话系统,支持在单台电脑上运行完整的功能。Open Avatar Chat 支持低延迟的实时对话(平均响...
MoCha–Meta联合滑铁卢大学推出的端到端对话角色视频生成模型
AI工具百科:
MoCha是什么
MoCha AI 是 Meta 和滑铁卢大学联合开发的端到端对话角色视频生成模型。能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。
MoCha 采用语...

