StableAudioOpenSmall–StabilityAI和Arm推出的文本到音频生成模型
AI工具百科:
Stable Audio Open Small是什么
Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型,参数量从11亿减少...
Llama4–Meta开源的多模态系列AI模型,重夺开源王座
AI工具百科:
Llama 4是什么
Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家(MoE)架构,在训练和推理时计算效率更高。Llama 4 目前有 Scout 和 Maverick 两个版本。
...
心响–百度推出的手机端超级智能体应用
AI工具百科:
心响是什么
心响是百度推出的AI任务完成引擎为核心的手机端超级智能体应用,基于自然语言交互帮助用户拆解复杂任务、动态执行可视化交付结果。
心响依托大模型与多智...
SpatialRAG–埃默里大学等机构推出的空间推理能力框架
AI工具百科:
SpatialRAG是什么
SpatialRAG(Spatial RetrievalAugmented Generation)是美国埃默里大学、德克萨斯大学奥斯汀分校推出的用在提升大型语言模型(LLMs)空间推理能力的框...
EviMed–AI医学信息搜索引擎,整合全球七大中英文医学数据库
AI工具百科:
EviMed是什么
EviMed 是基于 AI 智能算法的医学信息平台,主要为医学工作者和科研人员设计。整合了全球七大知名中英文医学数据库,提供多维度搜索、AI 智能分析、科研选...
LanDiff–浙大联合月之暗面推出的文本到视频生成混合框架
AI工具百科:
LanDiff是什么
LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,...
rabbitOSintern–rabbit推出的通用型AI智能体
AI工具百科:
rabbitOS intern是什么
rabbitOS Intern 由 AI 初创公司 rabbit 推出的通用型AI智能体。通过协调多个智能代理(agents)来完成复杂任务,展现出类似实习生水平的人类能力...
amis–百度开源的低代码前端框架
Ai工具百科:
amis是什么
amis 是百度开源的低代码前端框架,基于简单的 JSON 配置快速生成各种后台页面,无需编写复杂前端代码。amis支持表单、表格、图表、CRUD 操作等功能,提供丰...
AudioSDS–NVIDIA推出的扩展文本条件音频扩散模型
AI工具百科:
AudioSDS是什么
AudioSDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无...
StepR1VMini–阶跃星辰最新推出的多模态推理模型
AI工具百科:
StepR1VMini是什么
StepR1VMini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型...
Addsubtitle–AI视频翻译工具,自动生成时间同步的字幕
AI工具百科:
Addsubtitle是什么
Addsubtitle 是基于 AI 的在线视频编辑工具,通过智能技术为用户提供便捷的字幕添加、翻译及视频编辑服务。用户可以轻松将视频翻译成100多种语言,一...
Dolphin–清华联合海天瑞声推出的语音识别大模型
AI工具百科:
Dolphin是什么
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言...

