MineWorld–微软研究院开源的实时交互式世界模型
AI工具百科:
MineWorld是什么
MineWorld是微软研究院开源的基于《我的世界》(Minecraft)的实时交互式世界模型,基于视觉动作自回归Transformer架构,将游戏场景和动作转化为离散的t...
MedGemma–谷歌开源的AI医疗领域模型
AI工具百科:
MedGemma是什么
MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型。
4B模型擅长解...
KimiVL–月之暗面开源的轻量级多模态视觉语言模型
AI工具百科:
KimiVL是什么
KimiVL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M参数)...
SWEETRL–Meta推出的多轮强化学习框架
AI工具百科:
SWEETRL是什么
SWEETRL是Meta推出的多轮强化学习框架,专门用在训练大型语言模型(LLM)代理进行协作推理任务。SWEETR基于训练时的额外信息(如参考解决方案)优化“批评...
MetaStoneL17B–元石智算推出的轻量级推理模型
AI工具百科:
MetaStoneL17B是什么
MetaStoneL17B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖...
GLMZ1Rumination–智谱推出的沉思模型
AI工具百科:
GLMZ1Rumination是什么
GLMZ1Rumination 是智谱推出的沉思模型,基于 GLMZ1 进一步优化而成,具体参数为GLMZ1Rumination32B0414 。GLMZ1Rumination基于扩展强化学习训练...
MiniMind–开源的AI模型训练工具,2小时训练25.8M小模型
AI工具百科:
MiniMind是什么
MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25.8M参数,体积仅为GP...