BrowseComp–OpenAI开源的AIAgent网络浏览能力基准
AI工具百科:
BrowseComp是什么
BrowseComp 是 OpenAI 开源的用于评估 AI Agent网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史、体育、音...
VPP–清华和星动纪元推出的首个AIGC机器人大模型
AI工具百科:
VPP是什么
VPP(Video Prediction Policy)是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型,学习互联网上的大量视频数据,直接预测未来场景...
FastVLM–苹果推出的高效视觉语言模型
AI工具百科:
FastVLM是什么
FastVLM是苹果推出的高效的视觉语言模型(VLM),能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器,有效减少视觉token数量,显...
SkildBrain–SkildAI推出的具身智能基础模型
AI工具百科:
Skild Brain是什么
Skild Brain 是 Skild AI 推出的具身智能基础模型,成为多种机器人和任务的共享通用大脑。能适应不同的硬件和任务,具有强大的泛化能力。
可以集成...
Granite3.2–IBM开源的多模态系列AI模型
AI工具百科:
Granite 3.2是什么
Granite 3.2 是IBM开源的多模态AI模型系列,具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本, Granite 3.2 Instruct 提供实验性链式推...
Gemini2.5Flash–谷歌推出的最新AI推理模型
AI工具百科:
Gemini 2.5 Flash是什么
Gemini 2.5 Flash 是 Google 推出的高效、低延迟的最新 AI 模型,基于 Gemini 2.5 模型构建。Gemini 2.5 Flash在保持低延迟和成本效益的同时,引...
RoboBrain–智源研究院开源的具身大脑模型
AI工具百科:
RoboBrain是什么
RoboBrain是智源研究院推出的开源具身大脑模型,推动单机智能迈向群体智能。由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的ALoRA模块和...
Mindsera–AI日记应用,分析写作内容揭示隐藏的思维模式
工具百科:
Mindsera是什么
Mindsera 是先进的 AI 日记应用,基于AI技术帮助用户改善心理健康、提升思维能力和认知技能。Mindsera能分析用户的写作内容,揭示隐藏的情绪和思维模式,提...
GLMZ132B–智谱开源的新一代推理模型
AI工具百科:
GLMZ132B是什么
GLMZ132B是智谱公司开源的新一代推理模型,具体参数版本为GLMZ132B0414 。GLMZ132B基于 GLM432B0414 基座模型开发,基于深度优化训练,在数学、代码和逻...
Gemma3n–谷歌推出的端侧多模态AI模型
AI工具百科:
Gemma 3n是什么
Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型。基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 24B 参数模型水平。
模型参...
Llama4–Meta开源的多模态系列AI模型,重夺开源王座
AI工具百科:
Llama 4是什么
Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家(MoE)架构,在训练和推理时计算效率更高。Llama 4 目前有 Scout 和 Maverick 两个版本。
...
SpatialRAG–埃默里大学等机构推出的空间推理能力框架
AI工具百科:
SpatialRAG是什么
SpatialRAG(Spatial RetrievalAugmented Generation)是美国埃默里大学、德克萨斯大学奥斯汀分校推出的用在提升大型语言模型(LLMs)空间推理能力的框...

