KeySync–帝国理工联合弗罗茨瓦夫大学推出的口型同步框架
AI工具百科:
KeySync是什么
KeySync 是帝国理工学院和弗罗茨瓦夫大学推出的用在高分辨率口型同步框架,支持将输入音频与视频中的口型动作对齐。KeySync 基于两阶段框架实现,首先生成...
Heygem–硅基智能推出的开源数字人模型
AI工具百科:
Heygem是什么
Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成数字人形象和声音克隆,...
Speech02–MiniMax推出的新一代文本转语音模型
AI工具百科:
Speech02是什么
Speech02 是 MiniMax 推出的新一代文本到语音(TTS)模型。模型基于回归 Transformer 架构,实现零样本语音克隆,仅需几秒参考语音能生成高度相似的目标...
Chirp3–谷歌云推出的高清语音合成模型
AI工具百科:
Chirp 3是什么
Chirp 3 是谷歌云推出的高清语音合成模型,专为生成自然、生动的语音而设计。支持 248 种声音和 31 种语言,能捕捉人类语调的细微差别,语音输出更加贴近...
Airpost–AI视频广告生成工具,自动编写脚本、选择镜头、匹配音乐
AI工具百科:
Airpost是什么
Airpost是AI驱动的视频广告创意生成工具,专为电商营销人员设计。能快速将产品链接和素材转化为具有高转化率的UGC(用户生成内容)视频广告。
通过AI技术...
AvatarIV–HeyGen最新推出的AI数字人模型
AI工具百科:
Avatar IV是什么
Avatar IV 是 HeyGen 最新推出的AI数字人模型,用在快速创建逼真视频。用户只需上传一张照片和一段脚本或音频,能生成自然流畅的视频。模型基于音频驱动...
cpmGO–面壁智能推出的首个纯端侧汽车智能助手
AI工具百科:
cpmGO是什么
cpmGO (小钢炮超级助手)是面壁智能推出的全球首个纯端侧智能助手,专为汽车智能座舱设计。cpmGO 基于面壁小钢炮MiniCPM 端侧模型开发,具备视觉、语音、多...
LiveCC–字节联合新加坡国立大学开源的实时视频解说模型
AI工具百科:
LiveCC是什么
LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析...
必火AI–AI数字人生成平台,只需3分钟真人视频复刻逼真数字人形象
AI工具百科:
必火AI是什么
必火AI是专注于短视频创作的国产AI数字人工具,集成了数字人形象生成、语音合成、视频剪辑等多种功能。用户只需上传3分钟真人视频,可生成高度逼真的数字人...
KrillinAI–AI音视频翻译配音工具,支持一键部署全流程
AI工具百科:
Krillin AI是什么
Krillin AI 是基于大型语言模型(LLMs)的视频翻译、配音和语音克隆工具,专为视频创作者和内容出海者设计。支持一键部署全流程,可将视频从下载到成品...
Anylang.ai
AI视频工具,免费增值,AI视频翻译并保持音色和口型的同步
官网:https://anylang.ai/
Anylang.ai是由硅基智能推出的一款AI视频翻译工具,帮助用户跨越语言障碍,实现内容的全球化...
怪兽AI数字人
AI视频工具,免费+付费,人工智能数字人短视频创作和直播平台
官网:https://www.guaishouai.com
怪兽AI数字人是什么
怪兽AI数字人是由杭州怪兽智能科技开发的一个人工智能数字人视...
- 1
- 2

