SkyReelsV2–昆仑万维开源的无限时长电影生成模型
AI工具百科:
SkyReelsV2是什么
SkyReelsV2是昆仑万维SkyReels团队推出的无限时长电影生成模型,基于扩散强迫(Diffusionforcing)框架,结合多模态大语言模型(MLLM)、多阶段预训练...
IndexAniSora–B站开源的动漫视频生成模型
AI工具百科:
IndexAniSora是什么
IndexAniSora 是哔哩哔哩开源的先进动漫视频生成模型,模型支持一键生成多种动漫风格的视频,涵盖番剧片段、国创动画、VTuber 内容等。模型包含超过 ...
谛韵DiffRhythm–西北工业联合港中文推出的端到端音乐生成工具
AI工具百科:
DiffRhythm是什么
DiffRhythm(中文名称:谛韵) 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型(Latent Diffusion)技术,能快速...
Stitch–谷歌实验室推出的AI工具,能生成UI设计和前端代码
AI工具百科:
Stitch是什么
Stitch 是谷歌实验室(Google Labs)推出的基于生成式AI工具。能将简单的英语描述或图像迅速转化为用户界面(UI)设计以及支持运行的前端代码。Stitch 基于...
OmniCam–浙大联合上海交大等高校推出的多模态视频生成框架
AI工具百科:
OmniCam是什么
OmniCam 是先进的多模态视频生成框架,通过摄像机控制实现高质量的视频生成。支持多种输入模态组合,用户可以提供文本描述、视频中的轨迹或图像作为参考,...
Dream7B–港大联合华为诺亚方舟开源的扩散推理模型
AI工具百科:
Dream7B是什么
Dream7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream7B训练数据涵盖文本、数学和代码,预训练使用...
OmniSVG–复旦大学联合StepFun推出端到端多模态矢量图形生成模型
AI工具百科:
OmniSVG是什么
OmniSVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型。基于预训练视觉语言模型(VLM),通过创新的 SVG 标记化...
Uthana–AI3D角色动画生成平台,文字描述角色动作生成逼真动画
AI工具百科:
Uthana是什么
Uthana 是专注于3D角色动画生成的AI平台。平台基于简单的文字描述、参考视频或动作库搜索,快速为用户生成逼真的动画,支持适配任何骨骼结构的模型。
Ut...
Kiss3DGen–基于图像扩散模型的3D资产生成框架
AI工具百科:
Kiss3DGen是什么
Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3D Bundle Image”,将多视图图像及...
UNO–字节跳动推出的创新AI图像生成框架
AI工具百科:
UNO是什么
UNO是字节跳动推出创新的AI图像生成框架,突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法,能高质量地生成单主体和多主体图像,解决了多主体场景...
GCDance–萨里大学和江南大学推出的3D舞蹈生成框架
AI工具百科:
GCDance是什么
GCDance(GenreControlled 3D Full Body Dance Generation Driven by Music)是英国萨里大学和江南大学推出的3D舞蹈生成框架,能根据音乐和文本提示生成符...
Seedance1.0lite–火山引擎推出的视频生成模型
AI工具百科:
Seedance 1.0 lite是什么
Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨...