Lyria2–DeepMind推出的AI音乐生成模型
AI工具百科:
Lyria 2是什么
Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,作为 Vertex AI 平台的核心组件,具备高保真音频生成能力,能输出 48kHz、24bit 的专业级立体声...
KimiAudio–MoonshotAI开源的音频基础模型
AI工具百科:
KimiAudio是什么
KimiAudio 是 Moonshot AI 推出的开源音频基础模型,专注于音频理解、生成和对话任务。在超过 1300 万小时的多样化音频数据上进行预训练,具备强大的音...
AudioX–港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AI工具百科:
AudioX是什么
AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐...
Wondercraft
AI音频工具,免费增值,AI音频内容生成工具,可创建播客有声书等
官网:https://www.wondercraft.ai
Wondercraft是什么
Wondercraft是一款多功能的AI音频内容创作平台,通过生成式A...
音剪
AI音频工具,免费,喜马拉雅推出的一站式AI音频创作平台
官网:https://audioeditor.ximalaya.com/
音剪是什么
音剪是喜马拉雅推出的一站式AI音频创作平台,提供多情感多模态的AI辅...
NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型,能实现对语言、音频和视觉信息的全方位感知与...
Nooka–AI播客应用,收听时可随时提问实时互动
AI工具百科:
Nooka是什么
Nooka是创新的AI驱动的听书应用,提供全球优质非虚构类书籍的20分钟音频摘要。用户能在通勤、运动等碎片化时间里高效吸收知识。应用最大特色是能对话,用户...
Aero1Audio–LMMsLab推出的轻量级音频模型
AI工具百科:
Aero1Audio是什么
Aero1Audio 是 LMMsLab 开发的轻量级音频模型,基于 Qwen2.51.5B 构建,仅包含 1.5 亿参数。专为长音频处理设计,能支持长达 15 分钟的连续音频输入,...
StableAudioOpenSmall–StabilityAI和Arm推出的文本到音频生成模型
AI工具百科:
Stable Audio Open Small是什么
Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型,参数量从11亿减少...
AudioSDS–NVIDIA推出的扩展文本条件音频扩散模型
AI工具百科:
AudioSDS是什么
AudioSDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无...