MedGemma–谷歌开源的AI医疗领域模型
AI工具百科:
MedGemma是什么
MedGemma是谷歌推出的开源AI模型,专门用在医疗图像与文本分析。模型基于Gemma 3架构,包含4B参数的多模态模型和27B参数的纯文本模型。
4B模型擅长解...
LanPaint–零训练AI图像修复工具
AI工具百科:
LanPaint是什么
LanPaint 是用在Stable Diffusion 模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝...
InfiniteYou–字节跳动开源的身份保持图像生成框架
AI工具百科:
InfiniteYou是什么
InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 InfuseNet 将身...
ImageAI.pro–免费AI图像生成平台,精准捕捉创作意图和细节需求
AI工具百科:
ImageAI.pro是什么
ImageAI.pro 是专业级的 AI 图像生成平台,基于强大的 imgv2 Pro 引擎驱动,能生成高质量、多风格的图像作品。具备高级语义理解能力,能精准捕捉用户...
OmniAlignV–上海交大联合上海AILab等推出的高质量数据集
AI工具百科:
OmniAlignV是什么
OmniAlignV 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言模型(MLLMs)与人类偏好的对齐能力设计的高质...
LBM–AI图像转换框架,实现可控阴影生成
AI工具百科:
LBM是什么
LBM(Latent Bridge Matching)是Jasper Research团队推出的新型图像到图像转换框架,基于在潜在空间中构建桥匹配实现快速高效的图像转换。LBM仅需单步推理完...
EasyControlGhibli–免费生成吉卜力风格图像的AI模型
AI工具百科:
EasyControl Ghibli是什么
EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。
仅用1...
UniToken–复旦联合美团等机构推出的统一视觉编码框架
AI工具百科:
UniToken是什么
UniToken 是新型的自回归生成模型,专为多模态理解与生成任务设计。通过结合离散和连续的视觉表示,构建了一种统一的视觉编码框架,能同时捕捉图像的高级...
BLIP3o–SalesforceResearch等机构推出的多模态模型
AI工具百科:
BLIP3o是什么
BLIP3o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...
WaveSpeedAI–AI图像视频生成平台,提供多种高性能AI模型
AI工具百科:
WaveSpeedAI是什么
WaveSpeedAI 是 AI 图像和视频生成平台,提供多种高性能的 AI 模型,核心模型包括 HiDreamI1(170 亿参数的开源图像生成模型)、Fluxdev(120 亿参数...
ObjectMover–港大联合Adobe推出的新型图像编辑模型
AI工具百科:
ObjectMover是什么
ObjectMover 是香港大学和 Adobe Research 联合提出的新型图像编辑模型,解决图像中物体移动、插入和移除时出现的光照、阴影不协调以及物体失真等问题...
ImageFusionAI–免费AI图像合成工具,快速无缝融合多张图片
AI工具百科:
ImageFusion AI是什么
ImageFusion AI是免费的在线照片合成与增强工具,通过AI技术帮助用户快速、高效地将多张图片融合在一起,创造出独特的视觉效果。能将不同元素组合...