OmniAlignV–上海交大联合上海AILab等推出的高质量数据集
AI工具百科:
OmniAlignV是什么
OmniAlignV 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型(MLLMs)与人类偏好的对齐能力设计的高质...
SurveyGO卷姬–清华联合面壁智能开源的AI论文写作工具
工具百科:
SurveyGO是什么
SurveyGO(卷姬) 是清华联合面壁智能团队开源的AI论文写作工具。支持根据用户输入的论文主题和描述,快速生成结构清晰、内容丰富的综述文章,帮助科研人员...
ChineseLiPS–智源研究院联合南大开源的中文多模态语音识别数据集
AI工具百科:
ChineseLiPS是什么
ChineseLiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集,包含100小时的语音、视频和手动转录文本,创新性地融合了唇读视频和...
GLMZ132B–智谱开源的新一代推理模型
AI工具百科:
GLMZ132B是什么
GLMZ132B是智谱公司开源的新一代推理模型,具体参数版本为GLMZ132B0414 。GLMZ132B基于 GLM432B0414 基座模型开发,基于深度优化训练,在数学、代码和逻...
StableAudioOpenSmall–StabilityAI和Arm推出的文本到音频生成模型
AI工具百科:
Stable Audio Open Small是什么
Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型,参数量从11亿减少...
Dolphin–清华联合海天瑞声推出的语音识别大模型
AI工具百科:
Dolphin是什么
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言...
KiminaProver–月之暗面联合Numina推出的数学定理证明模型
AI工具百科:
KiminaProver是什么
KiminaProver是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严...
EasyControlGhibli–免费生成吉卜力风格图像的AI模型
AI工具百科:
EasyControl Ghibli是什么
EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。
仅用1...
混元图生视频–腾讯混元开源的图生视频模型
AI工具百科:
混元图生视频是什么
混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和...
Step1X3D–阶跃星辰联合LightIllusions开源的3D资产生成框架
AI工具百科:
Step1X3D是什么
Step1X3D 是StepFun联合LightIllusions推出的高保真、可控的 3D 资产生成框架。基于严格的数据整理流程,从超过 500 万个 3D 资产中筛选出 200 万个高质...
MAIDSR1–微软开源的AI模型,基于DeepSeekR1改进版
AI工具百科:
MAIDSR1是什么
MAIDSR1 是微软基于 DeepSeek R1 改进的AI模型。MAIDSR1基于后训练优化,支持响应 99.3% 的敏感话题提示,比原版提升 2 倍,将有害内容风险降低 50%。
...
GR00TN1–英伟达开源的人形机器人基础模型
AI工具百科:
GR00T N1是什么
GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T N1 基于大...

