VITAAudio–开源的端到端多模态语音大模型,低延迟、推理快
AI工具百科:
VITAAudio是什么
VITAAudio 是开源的端到端多模态语音大模型,...
PodAgent–港中文、微软、小红书联合推出的播客生成框架
AI工具百科:
PodAgent是什么
PodAgent 是香港中文大学、微软和小红书联合推...
VoiceCanvas–开源AI语音合成平台,支持多语言、多音色、声音克隆服务
AI工具百科:
VoiceCanvas是什么
VoiceCanvas 是开源的多语言语音合成平台。...
易途AI面试官–AI面试工具,模拟真实面试场景、提供实时语音反馈
AI工具百科:
易途AI面试官是什么
易途AI面试官是AI模拟面试产品。模拟真实...
ActorMode–ElevenLabs推出的AI语音生成工具
AI工具百科:
Actor Mode是什么
Actor Mode 是 ElevenLabs 推出的AI语音生成...
TexttoBark–ElevenLabs推出的AI“狗语”文本转语音模型
AI工具百科:
Text to Bark是什么
Text to Bark 是 ElevenLabs 推出的全球首...
Voila–开源端到端语音大模型,实现低延迟语音对话
AI工具百科:
Voila是什么
Voila 是开源的端到端语音大模型,专为语音交互而...
AudioX–港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AI工具百科:
AudioX是什么
AudioX 是香港科技大学和月之暗面联合提出的统一...
谛韵DiffRhythm–西北工业联合港中文推出的端到端音乐生成工具
AI工具百科:
DiffRhythm是什么
DiffRhythm(中文名称:谛韵) 是西北工业大...
Ztalk.ai–专注于实时语音翻译的AI桌面应用
AI工具百科:
Ztalk.ai是什么
Ztalk.ai 是AI桌面应用程序,专注于实时语音翻...
豆包·语音播客模型–火山引擎推出的语音播客模型
AI工具百科:
豆包·语音播客模型是什么
豆包·语音播客模型是字节跳动旗下火...
AbletonMCP–AI音乐制作工具,基于MCP支持音轨创建与修改
AI工具百科:
AbletonMCP是什么
AbletonMCP 是开源项目,基于模型上下文协议...