TokenFD–上海交大联合美团推出的细粒度图文对齐基础模型
AI工具百科:
TokenFD是什么
TokenFD是上海交通大学联合美团推出的细粒度图文对齐基础模型,主要用于文档理解任务。通过Token级对齐,实现了图像Token与语言Token在同一特征空间中的共...
Marker–AI文档转换工具,多格式转换为Markdown、JSON、HTML
AI工具百科:
Marker是什么
Marker 是开源的高精度文档转换工具,专注于将 PDF、Word 等多种文档格式快速、准确地转换为 Markdown、JSON 和 HTML 格式。
通过深度学习技术,自动去...
赤兔Chitu–清华联合清程极智开源的大模型推理引擎
AI工具百科:
Chitu是什么
Chitu(赤兔)是清华大学高性能计算研究所与清程极智联合开源的高性能大模型推理引擎,专为解决大模型在推理阶段的高成本和低效率问题设计,具有强大的硬件...
BAGEL–字节跳动开源的多模态基础模型
AI工具百科:
BAGEL是什么
BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(MoT),通过两个独立编码器分别捕捉图像的像素级和语...
CodeBuddy–腾讯云推出的AI编程助手
Ai工具百科:
CodeBuddy是什么
CodeBuddy 是腾讯云推出的 AI 编程助手,能帮助开发者高效编程。CodeBuddy 支持代码补全、诊断、优化、重构,能生成单元测试和进行代码评审。核心模式 C...
AgentPrune–同济联合港中文等机构推出的多智能体通信优化框架
AI工具百科:
AgentPrune是什么
AgentPrune 是同济大学、香港中文大学等机构联合提出的针对大型语言模型(LLM)驱动的多智能体系统通信优化框架,通过“剪枝”技术,剔除冗余或有害的通...
VoltAgent–开源的AIAgent构建和编排框架
AI工具百科:
VoltAgent是什么
VoltAgent 是开源的 TypeScript 框架,用在构建和编排 AI Agent。VoltAgent 提供构建 AI 应用的基础结构和工具,简化与大语言模型(LLM)的交互、状态管...
LocAgent–斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
Ai工具百科:
LocAgent是什么
LocAgent是斯坦福大学、耶鲁大学和南加州大学等机构联合推出的,专注于代码定位任务的框架,帮助开发者快速准确地找到代码库中需要修改的部分。LocAgent...
EmbodiedReasoner–浙大联合阿里等机构推出的具身交互推理模型
AI工具百科:
Embodied Reasoner是什么
Embodied Reasoner是浙江大学、中国科学院软件研究所、阿里巴巴集团等机构推出的新型的具身交互推理模型,基于视觉搜索、推理和行动协同完成复...
Math24o–SuperCLUE开源的高中奥林匹克数学竞赛推理测评基准
AI工具百科:
Math24o是什么
Math24o 是中文大模型测评基准 SuperCLUE 开源的高中奥林匹克数学竞赛级别的数学推理测评基准。主要用于评估大型语言模型在数学推理方面的能力。
使用2...
OpenComputerAgent–HuggingFace推出的免费云端AI Agent工具
AI工具百科:
Open Computer Agent是什么
Open Computer Agent 是 Hugging Face 推出的免费云端 AI Agent 工具。支持在 Linux 虚拟机中运行,基于预装的程序(如 Firefox)完成用户指...
LlamaNemotron–英伟达推出的系列推理模型
AI工具百科:
Llama Nemotron是什么
Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的后训练,加入推...

