文心大模型X1Turbo–百度推出的最新深度思考型模型
AI工具百科:
文心大模型X1 Turbo是什么
文心大模型X1 Turbo是百度推出的深度思考型模型,是文心大模型4.5 Turbo的升级版本,具备更先进的思维链和深度思考理能力,擅长文学创作、逻辑...
GR00TN1–英伟达开源的人形机器人基础模型
AI工具百科:
GR00T N1是什么
GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T N1 基于大...
龙猫LongCat–美团自主研发的生成式AI大模型
AI工具百科:
龙猫LongCat是什么
LongCat(龙猫)是美团自主研发的生成式AI大模型,通过人工智能技术提升公司内部工作效率和创新能力。模型具备强大的多模态能力,能处理文本、图像等...
AyaVision–Cohere推出多模态、多语言的视觉模型
AI工具百科:
Aya Vision是什么
Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、视觉问答、文...
Phi4reasoning–微软推出的Phi4推理模型系列
AI工具百科:
Phi4reasoning是什么
Phi4reasoning 是微软推出的 140 亿参数的推理模型,专为复杂推理任务设计。通过监督微调(SFT)训练而成,使用了 OpenAI 的 o3mini 模型生成的高质...
GeminiRobotics–谷歌DeepMind推出的具身智能大模型
AI工具百科:
Gemini Robotics是什么
Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型:Gemini Rob...
OpenVision–加州大学开源的视觉编码器家族
AI工具百科:
OpenVision是什么
OpenVision是加州大学圣克鲁兹分校(UCSC)推出的完全开放、高效且灵活的高级视觉编码器家族,专注于多模态学习。提供从5.9M到632.1M参数的多种规模模...
UniToken–复旦联合美团等机构推出的统一视觉编码框架
AI工具百科:
UniToken是什么
UniToken 是新型的自回归生成模型,专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示,构建了一种统一的视觉编码框架,能同时捕捉图像的高级...
InternVL3–上海AILab开源的多模态大语言模型
AI工具百科:
InternVL3是什么
InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时...
SeedThinkingv1.5–字节跳动推出的最新思考模型
AI工具百科:
SeedThinkingv1.5是什么
SeedThinkingv1.5 是字节跳动推出的推理智能模型,采用混合专家(MoE)架构,总参数量为 200B,每次激活 20B 参数。模型在多个基准测试中表现出...
MMEureka–上海AILab联合上交大等推出的多模态推理模型
AI工具百科:
MMEureka是什么
MMEureka 是上海人工智能实验室、上海创智学院、上海交通大学和香港大学的研究人员共同开发的多模态推理模型。模型通过基于规则的大规模强化学习(RL),...
A2A–谷歌开源的首个标准智能体交互协议
AI工具百科:
A2A是什么
A2A(Agent2Agent Protocol)是谷歌开源的首个标准智能体交互协议,让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式,打破系统孤岛,让智...

