VoiceCanvas–开源AI语音合成平台,支持多语言、多音色、声音克隆服务
AI工具百科:
VoiceCanvas是什么
VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和 MiniMax 等...
ActorMode–ElevenLabs推出的AI语音生成工具
AI工具百科:
Actor Mode是什么
Actor Mode 是 ElevenLabs 推出的AI语音生成工具,支持用户通过自己的声音指导 AI 生成语音内容。用户只需录制一段音频或上传已有音频文件,AI 能分析...
Voila–开源端到端语音大模型,实现低延迟语音对话
AI工具百科:
Voila是什么
Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自...
Ztalk.ai–专注于实时语音翻译的AI桌面应用
AI工具百科:
Ztalk.ai是什么
Ztalk.ai 是AI桌面应用程序,专注于实时语音翻译。支持超过30种语言,延迟小于100毫秒,能与Zoom、Google Meet、Teams等主流视频会议工具无缝集成。具备...
讯飞虚拟人
AI视频工具,免费增值,科大讯飞推出的全栈式AI虚拟人应用服务平台
官网:https://virtual-man.xfyun.cn/
讯飞虚拟人是科大讯飞推出的全栈式AI虚拟人应用服务平台,基于AI虚拟形象...
豆包·语音播客模型–火山引擎推出的语音播客模型
AI工具百科:
豆包·语音播客模型是什么
豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客模型。模型基于流式模型构建,可将文本秒级转化为双人对话式播客,具有低成本、高时效...
NoizAI–AI语音克隆与合成工具,支持情感化文本转语音
AI工具百科:
Noiz AI是什么
Noiz AI 是 AI 语音克隆与合成工具,专注于为用户提供高效、个性化的语音解决方案。基于自研的超大语音模型,能在310秒内通过简短录音克隆出与真人无异的...
Dia–开源文本转语音模型,支持生成自然逼真的对话语音
AI工具百科:
Dia是什么
Dia 是 Nari Labs 推出的开源文本转语音(TTS)模型,拥有 16亿参数,根据文本脚本直接生成高度逼真的对话语音,支持多说话者标记、情感语调控制以及非语言提...
Deepgram
AI音频工具,免费增值,快速低成本的AI语音文本互转API平台
官网:https://deepgram.partnerlinks.io
Deepgram是什么
Deepgram是一个提供先进的AI语音识别和自然语言处理技术的平台...
RESEMBLE.AI
AI音频工具,,AI人声生成工具
官网:https://www.resemble.ai/
RESEMBLE.AI是什么
RESEMBLE.AI 是基于人工智能技术生成逼真和个性化语音的平台。通过深度学习算法分析真实人类声音...
TTSMaker
AI音频工具,免费,马克配音(MakVoice)推出的免费AI文字转语音工具
官网:https://ttsmaker.cn/
TTSMaker是什么
TTSMaker是马克配音(MakVoice)推出的免费AI文字转语音工具,提...
ElevenLabs
AI音频工具,免费增值,AI文本转语音,支持包含中文在内的28种语言
官网:https://try.elevenlabs.io/
ElevenLabs 是国外一个火爆的AI文字转语音平台,目前已完成测试阶段并推出了...