ART–微软联合清华和北大等推出的多层透明图像生成技术
AI工具百科:
ART是什么
ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直接生成多个独立的透明图层(支持 RGBA 格式),图层...
HiDreamI1–智象未来开源的AI图像生成模型
AI工具百科:
HiDreamI1是什么
HiDreamI1是 HiDream.ai 团队推出的开源AI图像生成模型,拥有17亿参数,采用MIT许可证。模型在图像生成质量、提示词遵循能力等方面表现出色,支持逼真、...
PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型
AI工具百科:
Pixel Reasoner是什么
Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型(VLM),基于像素空间推理增强模型对视觉信息的理解和推理...
OrpheusTTS–开源AI语音合成系统,支持多种语音风格
AI工具百科:
Orpheus TTS是什么
Orpheus TTS 是基于 Llama3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本语音克隆能力,...
FractalGenerativeModels–麻省理工推出的分形生成模型
AI工具百科:
Fractal Generative Models是什么
Fractal Generative Models(分形生成模型)是麻省理工学院计算机科学与人工智能实验室和Google DeepMind团队推出的新型图像生成方法。...
CoSight–中兴通讯开源的超级智能体项目
AI工具百科:
CoSight是什么
CoSight是中兴通讯开源的超级智能体项目,为协同视觉分析平台及智能自动化底座。采用多智能体架构,构建“数字团队”协同体系,通过DAG任务引擎驱动,实现任...
Flowise–开源AI应用构建工具,拖拽式构建工作流
AI工具百科:
Flowise是什么
Flowise 是开源的低代码/无代码工具,帮助用户快速构建和部署基于大语言模型(LLM)的应用程序。通过可视化界面,让用户以拖拽的方式轻松搭建复杂的工作流...
RelightVid–上海AILab联合复旦等高校推出的视频重照明模型
AI工具百科:
RelightVid是什么
RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型,支持根据文本提示、...
PrintVerse–AI3D模型生成平台,支持真人照片直接转为3D图片
AI工具百科:
PrintVerse是什么
PrintVerse是在线 AI 3D模型生成平台,支持用户上传图片或文字生成3D模型。平台支持将真人照片转换成卡通手办风格的3D模型,方便用户进行3D打印。用户...
WindowsAIFoundry–微软推出的本地AI开发统一平台
AI工具百科:
Windows AI Foundry是什么
Windows AI Foundry 是微软推出的全新的 AI 开发平台。Windows AI Foundry 基于整合 Windows Copilot Runtime 及新增功能,为 AI 开发者提供从...
DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架
AI工具百科:
DanceGRPO是什么
DanceGRPO 是字节跳动 Seed 和香港大学联合推出的首个统一视觉生成强化学习框架。将强化学习应用在视觉生成领域,覆盖两大生成范式(diffusion 和 recti...
MegaTTS3–字节与浙江大学合作推出的零样本语音合成系统
AI工具百科:
MegaTTS 3是什么
MegaTTS 3是字节跳动与浙江大学合作推出的零样本文本到语音合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语音分解为内容...

