DistilQwen2.5R1–阿里推出的小型系列深度推理模型
AI工具百科:
DistilQwen2.5R1是什么
DistilQwen2.5R1 是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B、14B和32B四个参数量级的模型。
DistilQwen2.5R1将...
Instella–AMD开源的30亿参数系列语言模型
AI工具百科:
Instella是什么
Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成,基于自回归Transformer架构,包含36个解码器...
QwQ32B–阿里通义千问开源的最新推理模型
AI工具百科:
QwQ32B是什么
QwQ32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 6710 亿参数的 Deep...
XiaomiMiMo–小米开源的首个推理大模型
AI工具百科:
Xiaomi MiMo是什么
Xiaomi MiMo 是小米开源的首个推理(Reasoning)大模型,支持提升模型在复杂推理任务中的表现。模型基于联动预训练和后训练,挖掘大量富推理语料并采...
TokenFD–上海交大联合美团推出的细粒度图文对齐基础模型
AI工具百科:
TokenFD是什么
TokenFD是上海交通大学联合美团推出的细粒度图文对齐基础模型,主要用于文档理解任务。通过Token级对齐,实现了图像Token与语言Token在同一特征空间中的共...
天翼AI开放平台–中国电信推出的AI技术服务平台
AI工具百科:
天翼AI开放平台是什么
天翼AI开放平台是中国电信正式上线的AI技术服务平台。平台以中国电信自研的星辰大模型为技术底座,提供从AI技术能力展示到产品体验、接入使用的全...
GLMZ1Air–智谱推出的深度思考模型
AI工具百科:
GLMZ1Air是什么
GLMZ1Air 是智谱公司推出的基于 GLM4Air0414 的深度思考模型。GLMZ1Air在预训练阶段引入更多推理类数据,在对齐阶段深度优化通用能力,展现出强大的数理...
UniTok–字节联合港大、华中科技推出的统一视觉分词器
AI工具百科:
UniTok是什么
UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器,能同时支持视觉生成和理解任务。基于多码本量化技术,将视觉特征分割成多个小块,每块...
DeepSeekR1TChimera–TNG开源的语言模型
AI工具百科:
DeepSeekR1TChimera是什么
DeepSeekR1TChimera 是TNG科技公司推出的开源语言模型。结合 DeepSeek V30324 和DeepSeek R1两种模型的优势,基于创新的构建方法,将两者的神...
PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型
AI工具百科:
Pixel Reasoner是什么
Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型(VLM),基于像素空间推理增强模型对视觉信息的理解和推理...

