OpenMathNemotron–英伟达开源的数学推理系列模型
AI工具百科:
OpenMathNemotron是什么
OpenMathNemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathReaso...
WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型
AI工具百科:
WebSSL是什么
WebSSL(Webscale SelfSupervised Learning)是Meta、纽约大学等机构推出的视觉自监督学习(SSL)系列模型,基于大规模网络数据(如数十亿图像)训练视觉模...
子曰翻译2.0–网易有道推出的最新翻译大模型
子曰翻译2.0是什么
子曰翻译2.0是网易有道推出的最新翻译大模型,模型在数据、算法和评估三个关键维度进行了系统性升级,实现了翻译质量、效率和鲁棒性的质的飞跃。 在数据层面,有道收...
YuxiKnow–基于大模型RAG知识库的AI知识图谱问答平台
AI工具百科:
YuxiKnow是什么
YuxiKnow(语析)是基于大模型RAG知识库与知识图谱技术构建的智能问答平台。YuxiKnow支持多种知识库文件格式(如PDF、TXT、MD、Docx),支持将文件内容转...
文心大模型4.5Turbo–百度推出的最新多模态大模型
AI工具百科:
文心大模型4.5 Turbo是什么
文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图...
Step1XEdit–阶跃星辰开源的通用图像编辑框架
AI工具百科:
Step1XEdit是什么
Step1XEdit 是阶跃星辰团队推出的通用图像编辑框架,能缩小开源图像编辑模型与闭源模型(如 GPT4o 和 Gemini2 Flash)之间的性能差距。Step1XEdit结合...
MineWorld–微软研究院开源的实时交互式世界模型
AI工具百科:
MineWorld是什么
MineWorld是微软研究院开源的基于《我的世界》(Minecraft)的实时交互式世界模型,基于视觉动作自回归Transformer架构,将游戏场景和动作转化为离散的t...
MedGemma–谷歌开源的AI医疗领域模型
AI工具百科:
MedGemma是什么
MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型。
4B模型擅长解...
KimiVL–月之暗面开源的轻量级多模态视觉语言模型
AI工具百科:
KimiVL是什么
KimiVL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M参数)...
SWEETRL–Meta推出的多轮强化学习框架
AI工具百科:
SWEETRL是什么
SWEETRL是Meta推出的多轮强化学习框架,专门用在训练大型语言模型(LLM)代理进行协作推理任务。SWEETR基于训练时的额外信息(如参考解决方案)优化“批评...
MetaStoneL17B–元石智算推出的轻量级推理模型
AI工具百科:
MetaStoneL17B是什么
MetaStoneL17B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖...
GLMZ1Rumination–智谱推出的沉思模型
AI工具百科:
GLMZ1Rumination是什么
GLMZ1Rumination 是智谱推出的沉思模型,基于 GLMZ1 进一步优化而成,具体参数为GLMZ1Rumination32B0414 。GLMZ1Rumination基于扩展强化学习训练...