AudioSDS–NVIDIA推出的扩展文本条件音频扩散模型
AI工具百科:
AudioSDS是什么
AudioSDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无...
HRAvatar–清华联合IDEA推出的单目视频生成3D头像技术
AI工具百科:
HRAvatar是什么
HRAvatar是清华大学联合IDEA团队推出的单目视频重建技术,支持从普通单目视频中生成高质量、可重光照的3D头像。HRAvatar用可学习的形变基和线性蒙皮技术...
EasyControlGhibli–免费生成吉卜力风格图像的AI模型
AI工具百科:
EasyControl Ghibli是什么
EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。
仅用1...
混元图生视频–腾讯混元开源的图生视频模型
AI工具百科:
混元图生视频是什么
混元图生视频是腾讯混元推出的开源图生视频模型,用户可以通过上传一张图片进行简短描述,让图片动起来生成5秒的短视频。模型支持对口型、动作驱动和...
Pippit–字节旗下CapCut推出的AI营销内容创作平台
AI工具百科:
Pippit是什么
Pippit是字节旗下 CapCut 推出的AI营销内容创作平台,专为电商、社交媒体运营和品牌推广设计。帮助用户轻松生成高质量的视频和图片内容,无需专业设计技能...
OpusSearch–OpusClip推出的AI视频搜索工具
AI工具百科:
OpusSearch是什么
OpusSearch 是 OpusClip 推出的 AI 视频搜索工具,是专业创作者和企业的“定制 AI 大脑”,OpusSearch 能让用户快速搜索并再利用视频库中的任何内容,可...
KeySync–帝国理工联合弗罗茨瓦夫大学推出的口型同步框架
AI工具百科:
KeySync是什么
KeySync 是帝国理工学院和弗罗茨瓦夫大学推出的用在高分辨率口型同步框架,支持将输入音频与视频中的口型动作对齐。KeySync 基于两阶段框架实现,首先生成...
ACEStep–ACEStudio联合阶跃星辰开源的音乐生成基础模型
AI工具百科:
ACEStep是什么
ACEStep 是 ACE Studio 和 StepFun 联合推出的开源音乐生成基础模型,基于创新的架构设计实现高效、连贯且可控的音乐创作。ACEStep结合扩散模型、深度压缩...
KuaiMod–快手推出的自动化短视频质量判别框架
AI工具百科:
KuaiMod是什么
KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架,能高效识别和过滤有害及低质量内容。框架借鉴普通法(Common Law)体系,基于案例驱动的方式...
I2V3D–香港城市大学联合微软推出的图像到视频生成框架
AI工具百科:
I2V3D是什么
I2V3D是香港城市大学和微软 GenAI创新的图像到视频生成框架,支持将静态图像转换为动态视频,基于3D几何引导实现精确的动画控制。I2V3D结合传统计算机图形学...
Lyria2–DeepMind推出的AI音乐生成模型
AI工具百科:
Lyria 2是什么
Lyria 2 是谷歌 DeepMind 推出的第三代 AI 音乐生成模型,作为 Vertex AI 平台的核心组件,具备高保真音频生成能力,能输出 48kHz、24bit 的专业级立体声...
可灵AI国际版(KlingAI)–快手推出的AI视频和图像创作工具
AI工具百科:
可灵AI国际版是什么
可灵AI国际版(Kling AI) 是快手推出的AI视频和图像创作工具。专注于提供动态、美学和提示遵循方面极大改善的创意工具。可灵AI国际版提供多种功能,包...

