EasyControlGhibli–免费生成吉卜力风格图像的AI模型
AI工具百科:
EasyControl Ghibli是什么
EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。
仅用1...
混元图生视频–腾讯混元开源的图生视频模型
AI工具百科:
混元图生视频是什么
混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和...
MAIDSR1–微软开源的AI模型,基于DeepSeekR1改进版
AI工具百科:
MAIDSR1是什么
MAIDSR1 是微软基于 DeepSeek R1 改进的AI模型。MAIDSR1基于后训练优化,支持响应 99.3% 的敏感话题提示,比原版提升 2 倍,将有害内容风险降低 50%。
...
Step1X3D–阶跃星辰联合LightIllusions开源的3D资产生成框架
AI工具百科:
Step1X3D是什么
Step1X3D 是StepFun联合LightIllusions推出的高保真、可控的 3D 资产生成框架。基于严格的数据整理流程,从超过 500 万个 3D 资产中筛选出 200 万个高质...
GR00TN1–英伟达开源的人形机器人基础模型
AI工具百科:
GR00T N1是什么
GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境中的操作任务。GR00T N1 基于大...
AReaLboba–蚂蚁联合清华开源的强化学习训练框架
AI工具百科:
AReaLboba是什么
AReaLboba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaLboba是 AReaL 的升级版本,降低了强化学习训练门槛,用户能轻松训练推理模...
AyaVision–Cohere推出多模态、多语言的视觉模型
AI工具百科:
Aya Vision是什么
Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 23 种语言,能执行图像描述生成、视觉问答、文...
SuperGPQA–豆包大模型联合MAP开源的知识推理基准测试集
AI工具百科:
SuperGPQA是什么
SuperGPQA 是字节跳动豆包大模型团队联合 MAP 推出的全面覆盖 285 个研究生级学科、包含 26529 道专业题目的知识推理基准测试集。解决传统评测基准学科...
HoloPart–港大联合VAST开源生成完整可编辑部件的3D模型
AI工具百科:
HoloPart是什么
HoloPart 是香港大学、VAST 团队推出的新型扩散模型,支持将 3D 物体分解为完整、可编辑的语义部件,即使部件被遮挡。HoloPar基于两阶段方法,用局部注意...
DMind–专为Web3领域优化的大模型
AI工具百科:
DMind是什么
DMind是DMind研究机构发布的专为Web3领域优化的大型语言模型。针对区块链、去中心化金融和智能合约等场景深度优化,使用Web3数据微调采用RLHF技术对齐。
...
ACEStep–ACEStudio联合阶跃星辰开源的音乐生成基础模型
AI工具百科:
ACEStep是什么
ACEStep 是 ACE Studio 和 StepFun 联合推出的开源音乐生成基础模型,基于创新的架构设计实现高效、连贯且可控的音乐创作。ACEStep结合扩散模型、深度压缩...
OpenVision–加州大学开源的视觉编码器家族
AI工具百科:
OpenVision是什么
OpenVision是加州大学圣克鲁兹分校(UCSC)推出的完全开放、高效且灵活的高级视觉编码器家族,专注于多模态学习。提供从5.9M到632.1M参数的多种规模模...

