XDancer–字节等机构推出音乐驱动的人像舞蹈视频生成框架
AI工具百科:
XDancer是什么
XDancer 是字节跳动联合加州大学圣地亚哥分校和南加州大学的研究人员共同推出的音乐驱动的人像舞蹈视频生成框架,支持从单张静态图像生成多样化且逼真的全...
SuperEdit–字节跳动等机构推出的图像编辑方法
AI工具百科:
SuperEdit是什么
SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和效果。S...
扣子空间–字节跳动推出的通用型AIAgent
AI工具百科:
扣子空间是什么
扣子空间(Coze Space)是字节跳动推出的通用型 AI Agent,帮助用户快速搭建和管理 AI 应用。通过可视化界面,没有编程基础,用户也能轻松创建。
集成...
PikaTwists–PikaLabs推出的AI视频编辑功能
AI工具百科:
Pika Twists是什么
Pika Twists 是 Pika Labs 推出的 AI 视频编辑功能,能让用户轻松修改视频中的主体动作和场景,创造出奇幻效果。只需上传视频并描述需求,AI 可精准操...
PolloAI–新加坡HIX.AI推出的多模态AI视频生成平台
AI工具百科:
Pollo AI是什么
Pollo AI 是新加坡公司 HIX.AI 开发的多模态人工智能视频生成工具,通过 AI 技术降低视频创作门槛,让用户轻松将文本或图像转化为高质量视频。
用户输...
Asyncflowv1.0–Podcastle推出的AI文本转语音模型
AI工具百科:
Asyncflow v1.0是什么
Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 种语音选项,能为文本内容生成高质量的语音朗读,适用于多种语言和...
MuyanTTS–开源文本转语音模型,零样本语音合成
AI工具百科:
MuyanTTS是什么
MuyanTTS 是为播客场景设计的开源文本转语音(TTS)模型。模型预训练超过10万小时的播客音频数据,能实现零样本语音合成,无需大量目标说话人的语音数据...
Higgsfield–AI视频生成平台,提供专业电影节级相机控制能力
AI工具百科:
Higgsfield是什么
Higgsfield是AI视频生成平台,通过先进的 AI 技术,将简单的创意和文本提示转化为高质量的视频内容,适合电影制作、广告和社交媒体视频创作。
包括...
LTXV13B–Lightricks开源的最新视频生成模型
AI工具百科:
LTXV13B是什么
LTXV13B 是Lightricks推出的开源 AI 视频生成模型,拥有 130 亿参数。具备极高的生成速度,比同类产品快 30 倍,能在普通消费级显卡(如 4090/5090)上运...
MagicColor–香港科技大学推出的多实例线稿图着色框架
AI工具百科:
MagicColor是什么
MagicColor 是香港科技大学推出的多实例线稿图着色框架,支持高效地为线稿图添加色彩。MagicColor基于自监督训练策略和实例引导模块,解决多实例数据不...
Animon–免费AI动画生成平台,融合日式动漫美学
AI工具百科:
Animon是什么
Animon 是日本 Animon Dream Factory 推出的全球首个专注于动漫制作的 AI 视频生成平台。通过深度学习模型将日本传统动漫美学与尖端 AI 技术相结合,用户只...
OpenUtau–开源的AI歌声合成工具,自动适配系统语言
AI工具百科:
OpenUtau是什么
OpenUtau 是开源的歌声合成工具,兼容 UTAU 音源库和重采样器,支持 VSQX 导入、多语言界面及预渲染功能,帮助创作者快速预览作品节省时间。OpenUtau现代...

