Veo3–谷歌推出的新一代视频生成模型
AI工具百科:
Veo 3是什么
Veo 3是谷歌I/O开发者大会上发布的新一代视频生成模型。Veo 3是谷歌首个可生成视频背景音效的模型,能合成画面,能为鸟鸣、街头交通等场景配上相应的音效,...
GPTimage1–OpenAI推出的最新图像生成模型
AI工具百科:
GPTimage1是什么
GPTimage1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功...
NexusGen–魔搭联合华东师范等机构开源的全模态图像生成模型
AI工具百科:
NexusGen是什么
NexusGen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型,支持同时完成图像理解、生成和编辑任务。NexusGen融合强大的语言模型与扩散模型的...
TokenSwift–超长文本生成加速框架,90分钟内生成10万Token文本
AI工具百科:
TokenSwift是什么
TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,相比传统自回归模型的近5小时,速度提升了3...
Dia–开源文本转语音模型,支持生成自然逼真的对话语音
AI工具百科:
Dia是什么
Dia 是 Nari Labs 推出的开源文本转语音(TTS)模型,拥有 16亿参数,根据文本脚本直接生成高度逼真的对话语音,支持多说话者标记、情感语调控制以及非语言提...
Desearch–AI深度研究工具,自动梳理研究思路生成研究框架
AI工具百科:
Desearch是什么
Desearch是专注于深度研究和智能分析的平台,帮助用户高效获取有价值的信息并精准建立研究框架。平台提供了多种研究模式,包括普通模式、深度模式和专家...
Audiobox
AI音频工具,免费开源,Meta推出的免费开源的AI语音和声音生成模型
官网:https://audiobox.metademolab.com
Audiobox是Meta于2023年11月30日推出的免费开源的AI语音和声音生成模...
CustomSVG–Adobe联合香港城市大学推出的SVG定制生成框架
AI工具百科:
CustomSVG是什么
CustomSVG 是Adobe和香港城市大学推出的两阶段风格的SVG定制生成框架,基于文本提示生成具有定制风格的高质量 SVG 图形。
框架推出一种两阶段的生成...
ChatAnyone–阿里通义推出的实时风格化肖像视频生成框架
AI工具百科:
ChatAnyone是什么
ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。
采用高效分层运动扩...
VDraw–AI信息图表生成工具,自动提取文件关键信息一键生成图表
AI工具百科:
VDraw是什么
VDraw是基于AI技术的信息图表生成工具,帮助用户将文字、文件或视频内容快速转化为专业且个性化的视觉内容。用户能对生成的图表进行个性化定制,包括修改颜...
MusicMint–AI音乐生成工具,支持高度自定义生成的音乐
AI工具百科:
MusicMint是什么
MusicMint 是强大的 AI 音乐生成工具,帮助用户轻松创作个性化音乐作品。通过人工智能技术,让用户只需输入简单的描述或选择音乐风格,能快速生成独特的...
TheoremExplainAgent–AI教学双智能体,数理化定理自动转动画
AI工具百科:
TheoremExplainAgent是什么
TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视频帮助人们更好地理解数学和科学定理。Th...

