UROBench–AI基准测试工具,专为端到端语音对话模型设计
AI工具百科:
UROBench是什么
UROBench 是面向端到端语音对话模型(SDMs)的...
NovaSonic–亚马逊推出的新型生成式AI语音模型
AI工具百科:
Nova Sonic是什么
Nova Sonic 是亚马逊推出的新型生成式 AI 语...
ChineseLiPS–智源研究院联合南大开源的中文多模态语音识别数据集
AI工具百科:
ChineseLiPS是什么
ChineseLiPS 是智源研究院联合南开大学共同打...
Dolphin–清华联合海天瑞声推出的语音识别大模型
AI工具百科:
Dolphin是什么
Dolphin是清华大学电子工程系语音与音频技术实...
gpt4otranscribe–OpenAI推出的语音转文本模型
AI工具百科:
gpt4otranscribe是什么
gpt4otranscribe是 OpenAI 推出的高性...
FantasyTalking–阿里联合北邮推出静态肖像生成可控数字人的框架
AI工具百科:
FantasyTalking是什么
FantasyTalking 是阿里巴巴 AMAP 团队和...
KimiAudio–MoonshotAI开源的音频基础模型
AI工具百科:
KimiAudio是什么
KimiAudio 是 Moonshot AI 推出的开源音频基...
Speech02–MiniMax推出的新一代文本转语音模型
AI工具百科:
Speech02是什么
Speech02 是 MiniMax 推出的新一代文本到语音...
Chirp3–谷歌云推出的高清语音合成模型
AI工具百科:
Chirp 3是什么
Chirp 3 是谷歌云推出的高清语音合成模型,专为...
语音输入优化AI提示词
语音输入优化AI提示词,先用第三方应用将语音转换成文字,再用 ChatGPT 进行处理...
Lovify– 专为Lovable.dev设计的Chrome扩展插件
AI工具百科:
Lovify是什么
Lovify 是 Chrome 扩展插件,专为开发者提升 Lov...
Soundwave–港中文深圳开源的语音理解大模型
AI工具百科:
Soundwave是什么
Soundwave是香港中文大学(深圳)开源的语音...