AI软件工具学习大全 | 功能与应用全解析 - 黑喵大叔 - AI视频教程 | AI自动化工作流定制服务 | AI培训学习平台 | 黑喵大叔

AudioX–港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频

AudioX–港科大联合月之暗面推出的扩散变换器模型，任意内容生成音频

AI工具百科： AudioX是什么 AudioX 是香港科技大学和月之暗面联合提出的统一...

谛韵DiffRhythm–西北工业联合港中文推出的端到端音乐生成工具

谛韵DiffRhythm–西北工业联合港中文推出的端到端音乐生成工具

AI工具百科： DiffRhythm是什么 DiffRhythm（中文名称：谛韵）是西北工业大...

AbletonMCP–AI音乐制作工具，基于MCP支持音轨创建与修改

AbletonMCP–AI音乐制作工具，基于MCP支持音轨创建与修改

AI工具百科： AbletonMCP是什么 AbletonMCP 是开源项目，基于模型上下文协议...

Dia–开源文本转语音模型，支持生成自然逼真的对话语音

Dia–开源文本转语音模型，支持生成自然逼真的对话语音

AI工具百科： Dia是什么 Dia 是 Nari Labs 推出的开源文本转语音（TTS）模型...

Deepgram

AI音频工具，免费增值，快速低成本的AI语音文本互转API平台官网：https://...

Oliva–开源语音RAG助手，实时语音搜索向量数据库

Oliva–开源语音RAG助手，实时语音搜索向量数据库

AI工具百科： Oliva是什么 Oliva 是开源的语音RAG助手，结合 Langchain 和 S...

OrpheusTTS–开源AI语音合成系统，支持多种语音风格

OrpheusTTS–开源AI语音合成系统，支持多种语音风格

AI工具百科： Orpheus TTS是什么 Orpheus TTS 是基于 Llama3b 架构的开源文...

MegaTTS3–字节与浙江大学合作推出的零样本语音合成系统

MegaTTS3–字节与浙江大学合作推出的零样本语音合成系统

AI工具百科： MegaTTS 3是什么 MegaTTS 3是字节跳动与浙江大学合作推出的零...

MoshiVis–Kyutai开源的多模态实时语音模型

MoshiVis–Kyutai开源的多模态实时语音模型

AI工具百科： MoshiVis是什么 MoshiVis 是 Kyutai 推出的开源多模态语音模型...

SeniorTalk–智源联合南开开源的超高龄老年人中文对话语音数据集

SeniorTalk–智源联合南开开源的超高龄老年人中文对话语音数据集

AI工具百科： SeniorTalk是什么 SeniorTalk 是智源研究院联合南开大学计算机...

MuyanTTS–开源文本转语音模型，零样本语音合成

MuyanTTS–开源文本转语音模型，零样本语音合成

AI工具百科： MuyanTTS是什么 MuyanTTS 是为播客场景设计的开源文本转语音（...

Aero1Audio–LMMsLab推出的轻量级音频模型

Aero1Audio–LMMsLab推出的轻量级音频模型

AI工具百科： Aero1Audio是什么 Aero1Audio 是 LMMsLab 开发的轻量级音频模...

升级VIP
返回顶部

戳我👆下载：全球AI领域大咖课、AI全能商业技能教程、国外大神AI商业课...