AudioX–港科大联合月之暗面推出的扩散变换器模型,任意内容生成音频
AI工具百科:
AudioX是什么
AudioX 是香港科技大学和月之暗面联合提出的统一扩散变压器模型,专门用于从任意内容生成音频和音乐。模型能处理多种输入模态,包括文本、视频、图像、音乐...
XiaomiMiMo–小米开源的首个推理大模型
AI工具百科:
Xiaomi MiMo是什么
Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖掘大量富推理语料并采...
SpeciesNet–Google开源的动物物种识别AI模型
AI工具百科:
SpeciesNet是什么
SpeciesNet 是 Google 开源的人工智能模型,通过分析相机陷阱拍摄的照片来识别动物物种。基于超过 6500 万张图像训练而成,能识别超过 2000 种标签,包...
谛韵DiffRhythm–西北工业联合港中文推出的端到端音乐生成工具
AI工具百科:
DiffRhythm是什么
DiffRhythm(中文名称:谛韵) 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型(Latent Diffusion)技术,能快速...
AndroidGen–智谱推出增强大语言模型Agent能力的框架
AI工具百科:
AndroidGen是什么
AndroidGen 是智谱技术团队推出增强基于大语言模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情况下。
框架通过收集人类任务轨迹基于这些轨迹...
AIClothingTryOn–AI虚拟试穿应用,支持生成多版本试衣效果
AI工具百科:
AIClothingTryOn是什么
AIClothingTryOn 是基于 Python 的桌面应用程序,用 Google Gemini AI 技术实现虚拟试衣功能。AIClothingTryOn支持分别上传人物照片和服装照片,...
OpenBioMed–清华AIR联合水木分子推出的开源Agent平台
AI工具百科:
OpenBioMed是什么
OpenBioMed 是清华大学智能产业研究院(AIR)和水木分子共同推出的开源平台,专注于 AI 驱动的生物医学研究。是多模态表征学习工具包,能处理分子、蛋...
TokenFD–上海交大联合美团推出的细粒度图文对齐基础模型
AI工具百科:
TokenFD是什么
TokenFD是上海交通大学联合美团推出的细粒度图文对齐基础模型,主要用于文档理解任务。通过Token级对齐,实现了图像Token与语言Token在同一特征空间中的共...
Marker–AI文档转换工具,多格式转换为Markdown、JSON、HTML
AI工具百科:
Marker是什么
Marker 是开源的高精度文档转换工具,专注于将 PDF、Word 等多种文档格式快速、准确地转换为 Markdown、JSON 和 HTML 格式。
通过深度学习技术,自动去...
AgentPrune–同济联合港中文等机构推出的多智能体通信优化框架
AI工具百科:
AgentPrune是什么
AgentPrune 是同济大学、香港中文大学等机构联合提出的针对大型语言模型(LLM)驱动的多智能体系统通信优化框架,通过“剪枝”技术,剔除冗余或有害的通...
VoltAgent–开源的AIAgent构建和编排框架
AI工具百科:
VoltAgent是什么
VoltAgent 是开源的 TypeScript 框架,用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具,简化与大语言模型(LLM)的交互、状态管...
赤兔Chitu–清华联合清程极智开源的大模型推理引擎
AI工具百科:
Chitu是什么
Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件...

