VoiceCanvas–开源AI语音合成平台,支持多语言、多音色、声音克隆服务
AI工具百科:
VoiceCanvas是什么
VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和 MiniMax 等...
ActorMode–ElevenLabs推出的AI语音生成工具
AI工具百科:
Actor Mode是什么
Actor Mode 是 ElevenLabs 推出的AI语音生成工具,支持用户通过自己的声音指导 AI 生成语音内容。用户只需录制一段音频或上传已有音频文件,AI 能分析...
Voila–开源端到端语音大模型,实现低延迟语音对话
AI工具百科:
Voila是什么
Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自...
Ztalk.ai–专注于实时语音翻译的AI桌面应用
AI工具百科:
Ztalk.ai是什么
Ztalk.ai 是AI桌面应用程序,专注于实时语音翻译。支持超过30种语言,延迟小于100毫秒,能与Zoom、Google Meet、Teams等主流视频会议工具无缝集成。具备...
讯飞虚拟人
AI视频工具,免费增值,科大讯飞推出的全栈式AI虚拟人应用服务平台
官网:https://virtual-man.xfyun.cn/
讯飞虚拟人是科大讯飞推出的全栈式AI虚拟人应用服务平台,基于AI虚拟形象...
豆包·语音播客模型–火山引擎推出的语音播客模型
AI工具百科:
豆包·语音播客模型是什么
豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客模型。模型基于流式模型构建,可将文本秒级转化为双人对话式播客,具有低成本、高时效...