Granite3.2–IBM开源的多模态系列AI模型
AI工具百科:
Granite 3.2是什么
Granite 3.2 是IBM开源的多模态AI模型系列,具备强大的推理、视觉理解和预测能力。Granite 3.2包含多个版本, Granite 3.2 Instruct 提供实验性链式推...
StepR1VMini–阶跃星辰最新推出的多模态推理模型
AI工具百科:
StepR1VMini是什么
StepR1VMini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型...
SkyworkVLReward–SkyworkAI开源的多模态奖励模型
AI工具百科:
SkyworkVL Reward是什么
SkyworkVL Reward是Skywork AI开源的多模态奖励模型,能为多模态理解和推理任务提供可靠的奖励信号。模型基于Qwen2.5VL7BInstruct架构,基于添加...
VersatileOCRProgram–开源多模态OCR工具,精准提取复杂结构化数据
AI工具百科:
VersatileOCRProgram是什么
VersatileOCRProgram是开源多模态OCR工具,支持从复杂的教育材料中提取结构化数据,生成适合机器学习训练的高质量数据集。VersatileOCRProgra...
MistralSmall3.1–MistralAI开源的多模态AI模型
AI工具百科:
Mistral Small 3.1是什么
Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型,有 240 亿参数,基于 Apache 2.0 许可证发布。在文本和多模态任务上表现出色,支...
VITAAudio–开源的端到端多模态语音大模型,低延迟、推理快
AI工具百科:
VITAAudio是什么
VITAAudio 是开源的端到端多模态语音大模型,具有低延迟、推理速度快的特点。通过轻量级的多模态交叉标记预测(MCTP)模块,可在首次前向传播中生成音频...
OThinkMR1–OPPO联合港科大推出的多模态语言模型优化框架
AI工具百科:
OThinkMR1是什么
OThinkMR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整KullbackLeibler(KL)散度策略(GRPOD)和奖励模型,提...
明岐–上海交大推出的医学多模态大模型,精准诊断罕见病
AI工具百科:
明岐是什么
明岐是上海交通大学计算机学院LoCCS实验室推出的首个精准诊断罕见病的医学多模态大模型。基于“大模型能力矩阵 + 专家路由协同”的双引擎驱动架构,整合医学影...

