AudioX–港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AI工具百科:
AudioX是什么
AudioX 是香港科技大学和月之暗面联合提出的统一...
谛韵DiffRhythm–西北工业联合港中文推出的端到端音乐生成工具
AI工具百科:
DiffRhythm是什么
DiffRhythm(中文名称:谛韵) 是西北工业大...
AbletonMCP–AI音乐制作工具,基于MCP支持音轨创建与修改
AI工具百科:
AbletonMCP是什么
AbletonMCP 是开源项目,基于模型上下文协议...
Dia–开源文本转语音模型,支持生成自然逼真的对话语音
AI工具百科:
Dia是什么
Dia 是 Nari Labs 推出的开源文本转语音(TTS)模型...
Deepgram
AI音频工具,免费增值,快速低成本的AI语音文本互转API平台
官网:https://...
Oliva–开源语音RAG助手,实时语音搜索向量数据库
AI工具百科:
Oliva是什么
Oliva 是开源的语音RAG助手,结合 Langchain 和 S...
OrpheusTTS–开源AI语音合成系统,支持多种语音风格
AI工具百科:
Orpheus TTS是什么
Orpheus TTS 是基于 Llama3b 架构的开源文...
MegaTTS3–字节与浙江大学合作推出的零样本语音合成系统
AI工具百科:
MegaTTS 3是什么
MegaTTS 3是字节跳动与浙江大学合作推出的零...
MoshiVis–Kyutai开源的多模态实时语音模型
AI工具百科:
MoshiVis是什么
MoshiVis 是 Kyutai 推出的开源多模态语音模型...
SeniorTalk–智源联合南开开源的超高龄老年人中文对话语音数据集
AI工具百科:
SeniorTalk是什么
SeniorTalk 是智源研究院联合南开大学计算机...
MuyanTTS–开源文本转语音模型,零样本语音合成
AI工具百科:
MuyanTTS是什么
MuyanTTS 是为播客场景设计的开源文本转语音(...
Aero1Audio–LMMsLab推出的轻量级音频模型
AI工具百科:
Aero1Audio是什么
Aero1Audio 是 LMMsLab 开发的轻量级音频模...

