AudioSDS–NVIDIA推出的扩展文本条件音频扩散模型
AI工具百科:
AudioSDS是什么
AudioSDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无...
Addsubtitle–AI视频翻译工具,自动生成时间同步的字幕
AI工具百科:
Addsubtitle是什么
Addsubtitle 是基于 AI 的在线视频编辑工具,通过智能技术为用户提供便捷的字幕添加、翻译及视频编辑服务。用户可以轻松将视频翻译成100多种语言,一...
可灵AI国际版(KlingAI)–快手推出的AI视频和图像创作工具
AI工具百科:
可灵AI国际版是什么
可灵AI国际版(Kling AI) 是快手推出的AI视频和图像创作工具。专注于提供动态、美学和提示遵循方面极大改善的创意工具。可灵AI国际版提供多种功能,包...
Speech02–MiniMax推出的新一代文本转语音模型
AI工具百科:
Speech02是什么
Speech02 是 MiniMax 推出的新一代文本到语音(TTS)模型。模型基于回归 Transformer 架构,实现零样本语音克隆,仅需几秒参考语音能生成高度相似的目标...
DICETalk–复旦联合腾讯优图推出的情感化动态肖像生成框架
AI工具百科:
DICETalk是什么
DICETalk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架,支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICETalk引入情感...

