GeminiRobotics–谷歌DeepMind推出的具身智能大模型
AI工具百科:
Gemini Robotics是什么
Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型:Gemini Rob...
OpenVision–加州大学开源的视觉编码器家族
AI工具百科:
OpenVision是什么
OpenVision是加州大学圣克鲁兹分校(UCSC)推出的完全开放、高效且灵活的高级视觉编码器家族,专注于多模态学习。提供从5.9M到632.1M参数的多种规模模...
SkyworkVLReward–SkyworkAI开源的多模态奖励模型
AI工具百科:
SkyworkVL Reward是什么
SkyworkVL Reward是Skywork AI开源的多模态奖励模型,能为多模态理解和推理任务提供可靠的奖励信号。模型基于Qwen2.5VL7BInstruct架构,基于添加...
SkyworkOR1–昆仑万维开源的高性能系列推理模型
AI工具百科:
SkyworkOR1是什么
SkyworkOR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。SkyworkOR1包含三款模...
ScienceNavigator–AI科研平台,覆盖“读文献做计算做实验多学科协同”
AI工具百科:
Science Navigator是什么
Science Navigator(科学导航)是北京科学智能研究院与深势科技联合打造的新一代AI4S科研知识库与AI学术搜索平台。是全球首个覆盖“读文献做计算...
A2A–谷歌开源的首个标准智能体交互协议
AI工具百科:
A2A是什么
A2A(Agent2Agent Protocol)是谷歌开源的首个标准智能体交互协议,让不同框架和供应商构建的AI智能体相互协作。A2A基于标准化的通信方式,打破系统孤岛,让智...
MedReason–美国加州联合南洋理工等机构推出的医学推理框架
AI工具百科:
MedReason是什么
MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs...
SkyworkR1V–昆仑万维开源的多模态思维链推理模型
AI工具百科:
Skywork R1V是什么
Skywork R1V是昆仑万维开源的首款工业界多模态思维链推理模型,具备强大的视觉链式推理能力。Skywork R1V能对视觉输入进行多步逻辑推理,解决复杂的视...
BLIP3o–SalesforceResearch等机构推出的多模态模型
AI工具百科:
BLIP3o是什么
BLIP3o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...
COMET–字节开源的通信优化系统
AI工具百科:
COMET是什么
COMET是字节跳动推出的针对MixtureofExperts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算通信重叠技术,COMET将通信与...
Aether–上海AILab开源的生成式世界模型
AI工具百科:
Aether是什么
Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测...
Soundwave–港中文深圳开源的语音理解大模型
AI工具百科:
Soundwave是什么
Soundwave是香港中文大学(深圳)开源的语音理解大模型,专注于语音与文本的智能对齐和理解。通过创新的对齐适配器和压缩适配器技术,有效解决了语音和...

