RekaFlash3–RekaAI推出的开源推理模型
AI工具百科:
Reka Flash 3是什么
Reka Flash 3 是 Reka AI 推出的开源推理模型,拥有 21 亿参数。支持多模态输入,包括文本、图像、视频和音频,可处理最多 32k 个令牌的上下文长度,...
LTXV13B–Lightricks开源的最新视频生成模型
AI工具百科:
LTXV13B是什么
LTXV13B 是Lightricks推出的开源 AI 视频生成模型,拥有 130 亿参数。具备极高的生成速度,比同类产品快 30 倍,能在普通消费级显卡(如 4090/5090)上运...
KimiVL–月之暗面开源的轻量级多模态视觉语言模型
AI工具百科:
KimiVL是什么
KimiVL 是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M参数)...
Gemma3QAT–谷歌推出的最新开源模型,Gemma3量化版
AI工具百科:
Gemma 3 QAT是什么
Gemma 3 QAT(QuantizationAware Training)是谷歌推出的最新一代开源模型,是Gemma 3 的量化优化版本。通过量化感知训练技术,Gemma 3 QAT 在显著降...
MMaDA–字节联合普林斯顿大学等推出的多模态扩散模型
AI工具百科:
MMaDA是什么
MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模态扩散模型,支持跨文本推理、多模态理解和...
MetaStoneL17B–元石智算推出的轻量级推理模型
AI工具百科:
MetaStoneL17B是什么
MetaStoneL17B 是 MetaStone 系列中的轻量级推理模型,专为提升复杂下游任务的性能而设计。在数学和代码等核心推理基准测试中达到了并行模型的顶尖...
LHM–阿里通义开源的单图生成可动画3D人体模型
AI工具百科:
LHM是什么
LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构,融合3D几何...
GLMZ1Rumination–智谱推出的沉思模型
AI工具百科:
GLMZ1Rumination是什么
GLMZ1Rumination 是智谱推出的沉思模型,基于 GLMZ1 进一步优化而成,具体参数为GLMZ1Rumination32B0414 。GLMZ1Rumination基于扩展强化学习训练...
UniRig–清华联合VAST开源的通用自动骨骼绑定框架
AI工具百科:
UniRig是什么
UniRig是清华大学计算机系和VAST联合推出的创新自动骨骼绑定框架,用在处理复杂和多样化的3D模型。基于大型自回归模型和骨骼点交叉注意力机制,生成高质量...
InfiniteYou–字节跳动开源的身份保持图像生成框架
AI工具百科:
InfiniteYou是什么
InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 InfuseNet 将身...
SkyworkR1V2.0–昆仑万维开源的新版多模态推理模型
AI工具百科:
SkyworkR1V 2.0是什么
SkyworkR1V 2.0 是昆仑万维最新开源的多模态推理模型,专为复杂推理任务设计,具备强大的视觉与文本推理能力。模型基于混合强化学习和多模态奖励模...
Hunyuan3D2.0–腾讯推出的大规模3D资产生成系统
AI工具百科:
Hunyuan3D 2.0是什么
Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程:首先生成无纹理的几何模...

