ChineseLiPS–智源研究院联合南大开源的中文多模态语音识别数据集
AI工具百科:
ChineseLiPS是什么
ChineseLiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集,包含100小时的语音、视频和手动转录文本,创新性地融合了唇读视频和...
mnml.ai–AI渲染工具,支持手绘或数字草图转为多风格渲染图
AI工具百科:
mnml.ai是什么
mnml.ai 是专为建筑师和室内设计师打造的 AI 渲染工具,基于高效的工具优化设计工作流程。mnml.ai 提供超过 12 种工具和 40 多种风格,支持将手绘或数字草...
Offer蛙–AI面试助手,实时识别面试官问题生成答案
AI工具百科:
Offer蛙是什么
Offer蛙是专为面试者设计的AI面试助手,帮助用户在面试中轻松应对各种问题,提升面试表现,顺利拿下Offer。通过强大的AI技术,能实时语音识别面试官的问题...
StableAudioOpenSmall–StabilityAI和Arm推出的文本到音频生成模型
AI工具百科:
Stable Audio Open Small是什么
Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型,参数量从11亿减少...
EviMed–AI医学信息搜索引擎,整合全球七大中英文医学数据库
AI工具百科:
EviMed是什么
EviMed 是基于 AI 智能算法的医学信息平台,主要为医学工作者和科研人员设计。整合了全球七大知名中英文医学数据库,提供多维度搜索、AI 智能分析、科研选...
心响–百度推出的手机端超级智能体应用
AI工具百科:
心响是什么
心响是百度推出的AI任务完成引擎为核心的手机端超级智能体应用,基于自然语言交互帮助用户拆解复杂任务、动态执行可视化交付结果。
心响依托大模型与多智...
rabbitOSintern–rabbit推出的通用型AI智能体
AI工具百科:
rabbitOS intern是什么
rabbitOS Intern 由 AI 初创公司 rabbit 推出的通用型AI智能体。通过协调多个智能代理(agents)来完成复杂任务,展现出类似实习生水平的人类能力...
AudioSDS–NVIDIA推出的扩展文本条件音频扩散模型
AI工具百科:
AudioSDS是什么
AudioSDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无...
LanDiff–浙大联合月之暗面推出的文本到视频生成混合框架
AI工具百科:
LanDiff是什么
LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,...
amis–百度开源的低代码前端框架
Ai工具百科:
amis是什么
amis 是百度开源的低代码前端框架,基于简单的 JSON 配置快速生成各种后台页面,无需编写复杂前端代码。amis支持表单、表格、图表、CRUD 操作等功能,提供丰...

