WorldScore–斯坦福大学推出的世界生成模型统一评估基准
AI工具百科:
WorldScore是什么
WorldScore 是斯坦福大学提出的用于世界生成...
Qwen2.5VL32B–阿里开源的最新多模态模型
AI工具百科:
Qwen2.5VL32B是什么
Qwen2.5VL32B是阿里巴巴开源的多模态模型...
SimpleAR–复旦大学联合字节Seed团队推出的图像生成模型
AI工具百科:
SimpleAR是什么
SimpleAR 是复旦大学视觉与学习实验室和字节 S...
PixelFlow–港大联合Adobe推出的图像生成模型
AI工具百科:
PixelFlow是什么
PixelFlow 是香港大学和Adobe联合推出的图像...
MuyanTTS–开源文本转语音模型,零样本语音合成
AI工具百科:
MuyanTTS是什么
MuyanTTS 是为播客场景设计的开源文本转语音(...
Step1XEdit–阶跃星辰开源的通用图像编辑框架
AI工具百科:
Step1XEdit是什么
Step1XEdit 是阶跃星辰团队推出的通用图像编...
MineWorld–微软研究院开源的实时交互式世界模型
AI工具百科:
MineWorld是什么
MineWorld是微软研究院开源的基于《我的世界...
RekaFlash3–RekaAI推出的开源推理模型
AI工具百科:
Reka Flash 3是什么
Reka Flash 3 是 Reka AI 推出的开源推理...
LTXV13B–Lightricks开源的最新视频生成模型
AI工具百科:
LTXV13B是什么
LTXV13B 是Lightricks推出的开源 AI 视频生成模...
KimiVL–月之暗面开源的轻量级多模态视觉语言模型
AI工具百科:
KimiVL是什么
KimiVL 是月之暗面开源的轻量级多模态视觉语言模...
Gemma3QAT–谷歌推出的最新开源模型,Gemma3量化版
AI工具百科:
Gemma 3 QAT是什么
Gemma 3 QAT(QuantizationAware Training...
MMaDA–字节联合普林斯顿大学等推出的多模态扩散模型
AI工具百科:
MMaDA是什么
MMaDA(Multimodal Large Diffusion Language Mod...

