OmniReference–MidjourneyV7推出的图像参考功能
AI工具百科:
Omni Reference是什么
Omni Reference 是 Midjourney 推出的全能参考功能,支持用户将特定的人物、物体或场景从参考图像中嵌入到生成的图像中。Omni Reference 适用于Mid...
IMAGPose–南京理工大学推出姿态引导图像生成的统一框架
AI工具百科:
IMAGPose是什么
IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的局限性,如无法同时生成多个不同...
PieceitTogether–BriaAI等机构推出的图像生成框架
AI工具百科:
Piece it Together是什么
Piece it Together (PiT)是Bria AI等机构推出的创新图像生成框架,专门用在从部分视觉组件生成完整的概念图像。基于特定领域的先验知识,将用...
DreamFit–字节联合清华和中山大学推出的虚拟试衣框架
AI工具百科:
DreamFit是什么
DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。
框架能显著...
PixelHacker–华中科技联合VIVO推出的图像修复模型
AI工具百科:
PixelHacker是什么
PixelHacker 是华中科技大学和 VIVO AI Lab联合推出的图像修复(Image Inpainting)模型。基于引入潜在类别引导(Latent Categories Guidance, LCG)...
PixelFlow–港大联合Adobe推出的图像生成模型
AI工具百科:
PixelFlow是什么
PixelFlow 是香港大学和Adobe联合推出的图像生成模型,支持直接在像素空间中生成图像。PixelFlow基于高效的级联流建模,从低分辨率逐步提升到高分辨率,...
DiffBrush–北邮联合清华等机构推出的图像生成与编辑框架
AI工具百科:
DiffBrush是什么
DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的,无需训练的图像生成与编辑框架,支持用户基于手绘草图直观地控制图...
MedGemma–谷歌开源的AI医疗领域模型
AI工具百科:
MedGemma是什么
MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型。
4B模型擅长解...
LanPaint–零训练AI图像修复工具
AI工具百科:
LanPaint是什么
LanPaint 是用在Stable Diffusion 模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝...
InfiniteYou–字节跳动开源的身份保持图像生成框架
AI工具百科:
InfiniteYou是什么
InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 InfuseNet 将身...