SkyworkR1V2.0–昆仑万维开源的新版多模态推理模型
AI工具百科:
SkyworkR1V 2.0是什么
SkyworkR1V 2.0 是昆仑万维最新开源的多模态推理模型,专为复杂推理任务设计,具备强大的视觉与文本推理能力。模型基于混合强化学习和多模态奖励模...
MiniMind–开源的AI模型训练工具,2小时训练25.8M小模型
AI工具百科:
MiniMind是什么
MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25.8M参数,体积仅为GP...
UROBench–AI基准测试工具,专为端到端语音对话模型设计
AI工具百科:
UROBench是什么
UROBench 是面向端到端语音对话模型(SDMs)的全面基准测试工具。涵盖了多语言、多轮对话、副语言信息等多维度任务,全面评估语音对话模型的性能。基准包...
TheAIScientistv2–通用端到端AI系统,自动探索科学假设生成论文
工具百科:
The AI Scientistv2是什么
The AI Scientistv2 是 Sakana AI 、不列颠哥伦比亚大学、Vector研究所等机构联合推出的完全自动生成科学发现的端到端AI系统,支持自主地提出科...
OmniAlignV–上海交大联合上海AILab等推出的高质量数据集
AI工具百科:
OmniAlignV是什么
OmniAlignV 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型(MLLMs)与人类偏好的对齐能力设计的高质...
SurveyGO卷姬–清华联合面壁智能开源的AI论文写作工具
工具百科:
SurveyGO是什么
SurveyGO(卷姬) 是清华联合面壁智能团队开源的AI论文写作工具。支持根据用户输入的论文主题和描述,快速生成结构清晰、内容丰富的综述文章,帮助科研人员...
ChineseLiPS–智源研究院联合南大开源的中文多模态语音识别数据集
AI工具百科:
ChineseLiPS是什么
ChineseLiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集,包含100小时的语音、视频和手动转录文本,创新性地融合了唇读视频和...
StableAudioOpenSmall–StabilityAI和Arm推出的文本到音频生成模型
AI工具百科:
Stable Audio Open Small是什么
Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型,参数量从11亿减少...
GLMZ132B–智谱开源的新一代推理模型
AI工具百科:
GLMZ132B是什么
GLMZ132B是智谱公司开源的新一代推理模型,具体参数版本为GLMZ132B0414 。GLMZ132B基于 GLM432B0414 基座模型开发,基于深度优化训练,在数学、代码和逻...
Dolphin–清华联合海天瑞声推出的语音识别大模型
AI工具百科:
Dolphin是什么
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言...
KiminaProver–月之暗面联合Numina推出的数学定理证明模型
AI工具百科:
KiminaProver是什么
KiminaProver是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严...
EasyControlGhibli–免费生成吉卜力风格图像的AI模型
AI工具百科:
EasyControl Ghibli是什么
EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。
仅用1...

