UNO–字节跳动推出的创新AI图像生成框架
AI工具百科:
UNO是什么
UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景...
DDiT–耶鲁大学联合字节Seed等机构推出的多模态扩散模型
AI工具百科:
DDiT是什么
DDiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。
模型结合连续图...
GPTimage1–OpenAI推出的最新图像生成模型
AI工具百科:
GPTimage1是什么
GPTimage1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功...
Eagle2.5–英伟达推出的视觉语言模型
AI工具百科:
Eagle 2.5是什么
Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现...
NexusGen–魔搭联合华东师范等机构开源的全模态图像生成模型
AI工具百科:
NexusGen是什么
NexusGen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型,支持同时完成图像理解、生成和编辑任务。NexusGen融合强大的语言模型与扩散模型的...
UniFluid–谷歌联合麻省理工推出的多模态图像生成与理解框架
AI工具百科:
UniFluid是什么
UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成...
InstantCharacter–腾讯混元开源的定制化图像生成插件
AI工具百科:
InstantCharacter是什么
InstantCharacter 是腾讯混元开源的定制化图像生成插件。基于扩散 Transformer(DiT)框架,引入可扩展的适配器(包含多个 Transformer encoder...
MiracleF1–美图WHEE推出的AI图像生成模型
AI工具百科:
Miracle F1是什么
Miracle F1 是美图 WHEE 推出的全新AI图像生成模型。具备强大的图像生成能力,能像摄影师、建筑师和画家一样精准地处理光影、空间和材质效果,生成的图...
T2IR1–港中文联合上海AILab推出文生图模型
AI工具百科:
T2IR1是什么
T2IR1 是香港中文大学和上海AI Lab联合推出的新型文本生成图像模型。基于引入双层推理机制,语义级链式思维(CoT)和 Token 级 CoT,实现高层次图像规划与低...
OmniReference–MidjourneyV7推出的图像参考功能
AI工具百科:
Omni Reference是什么
Omni Reference 是 Midjourney 推出的全能参考功能,支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Reference 适用于Mid...
IMAGPose–南京理工大学推出姿态引导图像生成的统一框架
AI工具百科:
IMAGPose是什么
IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的局限性,如无法同时生成多个不同...
PieceitTogether–BriaAI等机构推出的图像生成框架
AI工具百科:
Piece it Together是什么
Piece it Together (PiT)是Bria AI等机构推出的创新图像生成框架,专门用在从部分视觉组件生成完整的概念图像。基于特定领域的先验知识,将用...