MineWorld–微软研究院开源的实时交互式世界模型
AI工具百科:
MineWorld是什么
MineWorld是微软研究院开源的基于《我的世界》(Minecraft)的实时交互式世界模型,基于视觉动作自回归Transformer架构,将游戏场景和动作转化为离散的t...
MedGemma–谷歌开源的AI医疗领域模型
AI工具百科:
MedGemma是什么
MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型。
4B模型擅长解...
KimiVL–月之暗面开源的轻量级多模态视觉语言模型
AI工具百科:
KimiVL是什么
KimiVL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M参数)...
SWEETRL–Meta推出的多轮强化学习框架
AI工具百科:
SWEETRL是什么
SWEETRL是Meta推出的多轮强化学习框架,专门用在训练大型语言模型(LLM)代理进行协作推理任务。SWEETR基于训练时的额外信息(如参考解决方案)优化“批评...
MetaStoneL17B–元石智算推出的轻量级推理模型
AI工具百科:
MetaStoneL17B是什么
MetaStoneL17B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖...
GLMZ1Rumination–智谱推出的沉思模型
AI工具百科:
GLMZ1Rumination是什么
GLMZ1Rumination 是智谱推出的沉思模型,基于 GLMZ1 进一步优化而成,具体参数为GLMZ1Rumination32B0414 。GLMZ1Rumination基于扩展强化学习训练...
MiniMind–开源的AI模型训练工具,2小时训练25.8M小模型
AI工具百科:
MiniMind是什么
MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25.8M参数,体积仅为GP...
Llama4–Meta开源的多模态系列AI模型,重夺开源王座
AI工具百科:
Llama 4是什么
Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家(MoE)架构,在训练和推理时计算效率更高。Llama 4 目前有 Scout 和 Maverick 两个版本。
...
KiminaProver–月之暗面联合Numina推出的数学定理证明模型
AI工具百科:
KiminaProver是什么
KiminaProver是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严...
AbsoluteZero–清华大学等机构推出的语言模型推理训练方法
AI工具百科:
Absolute Zero是什么
Absolute Zero是清华大学 LeapLab 团队联合北京通用人工智能研究院 NLCo 实验室和宾夕法尼亚州立大学推出的全新语言模型推理训练方法。Absolute Zer...
文心大模型X1Turbo–百度推出的最新深度思考型模型
AI工具百科:
文心大模型X1 Turbo是什么
文心大模型X1 Turbo是百度推出的深度思考型模型,是文心大模型4.5 Turbo的升级版本,具备更先进的思维链和深度思考理能力,擅长文学创作、逻辑...
SuperGPQA–豆包大模型联合MAP开源的知识推理基准测试集
AI工具百科:
SuperGPQA是什么
SuperGPQA 是字节跳动豆包大模型团队联合 MAP 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科...

