GeminiRobotics–谷歌DeepMind推出的具身智能大模型
AI工具百科:
Gemini Robotics是什么
Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型:Gemini Rob...
OpenVision–加州大学开源的视觉编码器家族
AI工具百科:
OpenVision是什么
OpenVision是加州大学圣克鲁兹分校(UCSC)推出的完全开放、高效且灵活的高级视觉编码器家族,专注于多模态学习。提供从5.9M到632.1M参数的多种规模模...
SkyworkOR1–昆仑万维开源的高性能系列推理模型
AI工具百科:
SkyworkOR1是什么
SkyworkOR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。SkyworkOR1包含三款模...
MeshifAI–AI3D模型生成平台,支持生成简单模型和纹理模型
AI工具百科:
MeshifAI是什么
MeshifAI 是AI文本转 3D 模型生成平台,能根据用户输入的文本提示快速生成 3D 模型,支持生成简单模型和纹理模型(PBR)两种类型,生成的模型为 .glb 格...
NotaGen–中央音乐学院联合北航、清华等推出的音乐生成模型
AI工具百科:
NotaGen是什么
NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言模型(LLM)的训练范式生成高质量的古典乐谱。NotaGen ...
InternVL3–上海AILab开源的多模态大语言模型
AI工具百科:
InternVL3是什么
InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时...
SeedThinkingv1.5–字节跳动推出的最新思考模型
AI工具百科:
SeedThinkingv1.5是什么
SeedThinkingv1.5 是字节跳动推出的推理智能模型,采用混合专家(MoE)架构,总参数量为 200B,每次激活 20B 参数。模型在多个基准测试中表现出...
TripoSR–StabilityAI联合VAST开源的3D生成模型
AI工具百科:
TripoSR是什么
TripoSR是Stability AI和VAST联合推出的开源3D生成模型,能在不到0.5秒内从单张2D图像快速生成高质量的3D模型。模型基于Transformer架构,采用了大型重建...
BLIP3o–SalesforceResearch等机构推出的多模态模型
AI工具百科:
BLIP3o是什么
BLIP3o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...
OLMo232B–Ai2推出的最新开源语言模型
AI工具百科:
OLMo 2 32B是什么
OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言模型,是 OLMo 2 系列的重要成果。拥有 320 亿参数,是首个在多技能学术基准测试中超...
SpatialLM–群核科技开源的空间理解多模态模型
AI工具百科:
SpatialLM是什么
SpatialLM 是群核科技开源的空间理解多模态模型,赋予机器人和智能系统类似人类的空间认知能力。通过分析普通手机拍摄的视频,能重建出详细的 3D 场景布局...
文心大模型X1–百度推出的深度思考模型
AI工具百科:
文心大模型X1是什么
文心大模型X1是百度推出的深度思考模型。具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等。
X1增加了多模态能力,能理解和生成图片,能...

