UniToken–复旦联合美团等机构推出的统一视觉编码框架
AI工具百科:
UniToken是什么
UniToken 是新型的自回归生成模型,专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示,构建了一种统一的视觉编码框架,能同时捕捉图像的高级...
BLIP3o–SalesforceResearch等机构推出的多模态模型
AI工具百科:
BLIP3o是什么
BLIP3o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...
WaveSpeedAI–AI图像视频生成平台,提供多种高性能AI模型
AI工具百科:
WaveSpeedAI是什么
WaveSpeedAI 是 AI 图像和视频生成平台,提供多种高性能的 AI 模型,核心模型包括 HiDreamI1(170 亿参数的开源图像生成模型)、Fluxdev(120 亿参数...
ObjectMover–港大联合Adobe推出的新型图像编辑模型
AI工具百科:
ObjectMover是什么
ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型,解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等问题...
ImageFusionAI–免费AI图像合成工具,快速无缝融合多张图片
AI工具百科:
ImageFusion AI是什么
ImageFusion AI是免费的在线照片合成与增强工具,通过AI技术帮助用户快速、高效地将多张图片融合在一起,创造出独特的视觉效果。能将不同元素组合...
EasyControl–TiamatAI联合上海科大等开源的图像生成控制框架
AI工具百科:
EasyControl是什么
EasyControl 是 Tiamat AI 开源的基于扩散变换器(Diffusion Transformer,DiT)架构的高效灵活控制框架,通过轻量级条件注入 LoRA 模块,独立处理条...
MiniDALL·E3–北京理工联合上海AILab等高校推出的交互式文生图框架
AI工具百科:
Mini DALL·E 3是什么
Mini DALL·E 3 是北京理工大学、上海AI Lab、清华大学和香港中文大学联合推出的交互式文本到图像(iT2I)框架。基于自然语言与用户进行多轮对话,实...
Imagen4–谷歌推出的最新图像生成AI模型
AI工具百科:
Imagen 4是什么
Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染...
QLIP–英伟达推出的视觉标记化方法
AI工具百科:
QLIP是什么
QLIP(Quantized LanguageImage Pretraining)是英伟达等推出的视觉标记化方法,结合高质量的图像重建和零样本图像理解能力。QLIP二进制球形量化(BSQ)的自...
LightLab–谷歌等机构推出的图像光源控制模型
AI工具百科:
LightLab是什么
LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。模型支持用户调整光源的强度和颜色,插入虚...
Image01–MiniMax推出的文本到图像生成模型
AI工具百科:
Image01是什么
Image01 是 MiniMax 推出的先进文本到图像生成模型,具备卓越的图像生成能力。能将用户输入的文本描述精准转化为高质量图像,支持多种纵横比和高分辨率输...
MCACtrl–中科院和中科大推出的图像定制生成框架
AI工具百科:
MCACtrl是什么
MCACtrl(Multiparty Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂视觉条件实现高质量的...