PixelFlow–港大联合Adobe推出的图像生成模型
AI工具百科:
PixelFlow是什么
PixelFlow 是香港大学和Adobe联合推出的图像生成模型,支持直接在像素空间中生成图像。PixelFlow基于高效的级联流建模,从低分辨率逐步提升到高分辨率,...
DiffBrush–北邮联合清华等机构推出的图像生成与编辑框架
AI工具百科:
DiffBrush是什么
DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的,无需训练的图像生成与编辑框架,支持用户基于手绘草图直观地控制图...
MuyanTTS–开源文本转语音模型,零样本语音合成
AI工具百科:
MuyanTTS是什么
MuyanTTS 是为播客场景设计的开源文本转语音(TTS)模型。模型预训练超过10万小时的播客音频数据,能实现零样本语音合成,无需大量目标说话人的语音数据...
Step1XEdit–阶跃星辰开源的通用图像编辑框架
AI工具百科:
Step1XEdit是什么
Step1XEdit 是阶跃星辰团队推出的通用图像编辑框架,能缩小开源图像编辑模型与闭源模型(如 GPT4o 和 Gemini2 Flash)之间的性能差距。Step1XEdit结合...
MathModelAgent–开源的数学建模Agent,全自动建模流程
AI工具百科:
MathModelAgent是什么
MathModelAgent 是专为数学建模设计的Agent,能自动完成从问题分析到论文生成的全流程。基于多Agent协作,自动建立数学模型、编写代码、验证结果,...
RAGEN–训练大模型推理Agent的开源强化学习框架
AI工具百科:
RAGEN是什么
RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(StateThinkingActionReward Policy Optimization)框...
MineWorld–微软研究院开源的实时交互式世界模型
AI工具百科:
MineWorld是什么
MineWorld是微软研究院开源的基于《我的世界》(Minecraft)的实时交互式世界模型,基于视觉动作自回归Transformer架构,将游戏场景和动作转化为离散的t...
InfiniteMobility–上海AILab推出的可交互物体生成模型
AI工具百科:
Infinite Mobility是什么
Infinite Mobility 是上海AI Lab推出的可交互物体生成模型,基于程序化生成技术,高效生成高质量的可交互物体数据资产。
Infinite Mobility...
LanPaint–零训练AI图像修复工具
AI工具百科:
LanPaint是什么
LanPaint 是用在Stable Diffusion 模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝...
Pad.ws–在线AI开发工具,白板功能与代码编辑器深度结合
Ai工具百科:
Pad.ws是什么
Pad.ws 是创新的在线开发环境,结合了白板功能与完整的 IDE 工具。基于浏览器运行,无需安装额外软件,用户可以随时随地通过任何设备访问。将交互式白板与...
VibeDraw–AI3D建模工具,涂鸦草图一键转为3D模型
AI工具百科:
Vibe Draw是什么
Vibe Draw是开源的 AI 3D建模工具,支持将用户在2D画布上绘制的涂鸦草图转化为精美的3D模型。用户能用文本提示或继续绘制迭代优化模型,一键导出为标准...
Yourware–AI网页构建平台,一键将网页代码快速上线
Ai工具百科:
Yourware是什么
Yourware 是提供快速部署工具的在线平台,支持 HTML、CSS、JavaScript 和 React 等前端技术。基于一键部署功能,让用户轻松将网页代码快速上线,无需复杂...

