OmniSVG–复旦大学联合StepFun推出端到端多模态矢量图形生成模型
AI工具百科:
OmniSVG是什么
OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型。基于预训练视觉语言模型(VLM),通过创新的 SVG 标记化...
Dream7B–港大联合华为诺亚方舟开源的扩散推理模型
AI工具百科:
Dream7B是什么
Dream7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream7B训练数据涵盖文本、数学和代码,预训练使用...
Uthana–AI3D角色动画生成平台,文字描述角色动作生成逼真动画
AI工具百科:
Uthana是什么
Uthana 是专注于3D角色动画生成的AI平台。平台基于简单的文字描述、参考视频或动作库搜索,快速为用户生成逼真的动画,支持适配任何骨骼结构的模型。
Ut...
Kiss3DGen–基于图像扩散模型的3D资产生成框架
AI工具百科:
Kiss3DGen是什么
Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3D Bundle Image”,将多视图图像及...
UNO–字节跳动推出的创新AI图像生成框架
AI工具百科:
UNO是什么
UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景...
GCDance–萨里大学和江南大学推出的3D舞蹈生成框架
AI工具百科:
GCDance是什么
GCDance(GenreControlled 3D Full Body Dance Generation Driven by Music)是英国萨里大学和江南大学推出的3D舞蹈生成框架,能根据音乐和文本提示生成符...
MyLens–AI时间轴生成工具,自动生成关键事件的视觉图表
AI工具百科:
MyLens是什么
MyLens 是AI时间轴生成工具。MyLens 支持将用户的想法、文字内容或数据快速转化为直观的视觉图表,如时间线、思维导图、象限图和表格。基于智能算法,MyLens ...
Seedance1.0lite–火山引擎推出的视频生成模型
AI工具百科:
Seedance 1.0 lite是什么
Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨...
ImagePulse–魔搭社区开源的图像理解和生成模型数据集
AI工具百科:
ImagePulse是什么
ImagePulse (图律脉动)是魔搭社区推出的开源项目,为下一代图像理解和生成模型提供数据集支持,通过原子化模型的能力并构建原子能力数据集。
项目...
DDiT–耶鲁大学联合字节Seed等机构推出的多模态扩散模型
AI工具百科:
DDiT是什么
DDiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。
模型结合连续图...
WeGen–中科大联合上海交大等推出的统一多模态生成模型
AI工具百科:
WeGen是什么
WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉生成任务。
WeGen结合...
DeepMesh–清华和南洋理工推出的3D网格生成框架
AI工具百科:
DeepMesh是什么
DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架,基于强化学习和自回归变换器生成高质量的 3D 网格。
通过两项关键创新来优化网格...

