TokenSwift–超长文本生成加速框架,90分钟内生成10万Token文本
AI工具百科:
TokenSwift是什么
TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,相比传统自回归模型的近5小时,速度提升了3...
Dia–开源文本转语音模型,支持生成自然逼真的对话语音
AI工具百科:
Dia是什么
Dia 是 Nari Labs 推出的开源文本转语音(TTS)模型,拥有 16亿参数,根据文本脚本直接生成高度逼真的对话语音,支持多说话者标记、情感语调控制以及非语言提...
Desearch–AI深度研究工具,自动梳理研究思路生成研究框架
AI工具百科:
Desearch是什么
Desearch是专注于深度研究和智能分析的平台,帮助用户高效获取有价值的信息并精准建立研究框架。平台提供了多种研究模式,包括普通模式、深度模式和专家...
CustomSVG–Adobe联合香港城市大学推出的SVG定制生成框架
AI工具百科:
CustomSVG是什么
CustomSVG 是Adobe和香港城市大学推出的两阶段风格的SVG定制生成框架,基于文本提示生成具有定制风格的高质量 SVG 图形。
框架推出一种两阶段的生成...
ChatAnyone–阿里通义推出的实时风格化肖像视频生成框架
AI工具百科:
ChatAnyone是什么
ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的肖像视频。
采用高效分层运动扩...
VDraw–AI信息图表生成工具,自动提取文件关键信息一键生成图表
AI工具百科:
VDraw是什么
VDraw是基于AI技术的信息图表生成工具,帮助用户将文字、文件或视频内容快速转化为专业且个性化的视觉内容。用户能对生成的图表进行个性化定制,包括修改颜...
MusicMint–AI音乐生成工具,支持高度自定义生成的音乐
AI工具百科:
MusicMint是什么
MusicMint 是强大的 AI 音乐生成工具,帮助用户轻松创作个性化音乐作品。通过人工智能技术,让用户只需输入简单的描述或选择音乐风格,能快速生成独特的...
TheoremExplainAgent–AI教学双智能体,数理化定理自动转动画
AI工具百科:
TheoremExplainAgent是什么
TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视频帮助人们更好地理解数学和科学定理。Th...
ART–微软联合清华和北大等推出的多层透明图像生成技术
AI工具百科:
ART是什么
ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直接生成多个独立的透明图层(支持 RGBA 格式),图层...
HiDreamI1–智象未来开源的AI图像生成模型
AI工具百科:
HiDreamI1是什么
HiDreamI1是 HiDream.ai 团队推出的开源AI图像生成模型,拥有17亿参数,采用MIT许可证。模型在图像生成质量、提示词遵循能力等方面表现出色,支持逼真、...
FractalGenerativeModels–麻省理工推出的分形生成模型
AI工具百科:
Fractal Generative Models是什么
Fractal Generative Models(分形生成模型)是麻省理工学院计算机科学与人工智能实验室和Google DeepMind团队推出的新型图像生成方法。...
DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架
AI工具百科:
DanceGRPO是什么
DanceGRPO 是字节跳动 Seed 和香港大学联合推出的首个统一视觉生成强化学习框架。将强化学习应用在视觉生成领域,覆盖两大生成范式(diffusion 和 recti...