Lipsync2–SyncLabs推出的首个零shot嘴型同步模型
AI工具百科:
Lipsync2是什么
Lipsync2 是 Sync Labs 推出的全球首个零shot 嘴型同步模型。无需针对特定演讲者进行预训练,能即时学习并生成符合独特说话风格的嘴型同步效果。
模型...
Narakeet–AI文本转语音平台,支持100种语言和800种声音
AI工具百科:
Narakeet是什么
Narakeet 是功能强大的在线平台,基于自然语音合成技术快速创建配音和旁白视频。Narakeet支持 100 种语言和 800 种声音,将文本、Word 文档、PPT 演示文...
VeoGoAI–AI短视频预测工具,提供流量预测和优化建议
AI工具百科:
VeoGo AI是什么
VeoGo AI 是面向短视频创作者的智能预测工具,通过深度学习算法提前预测视频流量表现,提供秒级优化建议,帮助创作者提升视频曝光率和点击率。基于深度神...
九歌–清华大学推出的AI诗歌写作工具
工具百科:
九歌是什么
九歌是清华大学自然语言处理与社会人文计算实验室推出的AI诗歌写作系统。九歌基于深度学习技术,用超过80万首人类诗人创作的诗歌进行训练,辅助用户生成符合古...
AudioSDS–NVIDIA推出的扩展文本条件音频扩散模型
AI工具百科:
AudioSDS是什么
AudioSDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无...
EasyControlGhibli–免费生成吉卜力风格图像的AI模型
AI工具百科:
EasyControl Ghibli是什么
EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。
仅用1...
HRAvatar–清华联合IDEA推出的单目视频生成3D头像技术
AI工具百科:
HRAvatar是什么
HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术,支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术...
混元图生视频–腾讯混元开源的图生视频模型
AI工具百科:
混元图生视频是什么
混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和...
Pippit–字节旗下CapCut推出的AI营销内容创作平台
AI工具百科:
Pippit是什么
Pippit是字节旗下 CapCut 推出的AI营销内容创作平台,专为电商、社交媒体运营和品牌推广设计。帮助用户轻松生成高质量的视频和图片内容,无需专业设计技能...
KeySync–帝国理工联合弗罗茨瓦夫大学推出的口型同步框架
AI工具百科:
KeySync是什么
KeySync 是帝国理工学院和弗罗茨瓦夫大学推出的用在高分辨率口型同步框架,支持将输入音频与视频中的口型动作对齐。KeySync 基于两阶段框架实现,首先生成...
OpusSearch–OpusClip推出的AI视频搜索工具
AI工具百科:
OpusSearch是什么
OpusSearch 是 OpusClip 推出的 AI 视频搜索工具,是专业创作者和企业的“定制 AI 大脑”,OpusSearch 能让用户快速搜索并再利用视频库中的任何内容,可...
ACEStep–ACEStudio联合阶跃星辰开源的音乐生成基础模型
AI工具百科:
ACEStep是什么
ACEStep 是 ACE Studio 和 StepFun 联合推出的开源音乐生成基础模型,基于创新的架构设计实现高效、连贯且可控的音乐创作。ACEStep结合扩散模型、深度压缩...

