MyLens–AI时间轴生成工具,自动生成关键事件的视觉图表
AI工具百科:
MyLens是什么
MyLens 是AI时间轴生成工具。MyLens 支持将用户的想法、文字内容或数据快速转化为直观的视觉图表,如时间线、思维导图、象限图和表格。基于智能算法,MyLens ...
ImagePulse–魔搭社区开源的图像理解和生成模型数据集
AI工具百科:
ImagePulse是什么
ImagePulse (图律脉动)是魔搭社区推出的开源项目,为下一代图像理解和生成模型提供数据集支持,通过原子化模型的能力并构建原子能力数据集。
项目...
DDiT–耶鲁大学联合字节Seed等机构推出的多模态扩散模型
AI工具百科:
DDiT是什么
DDiT(Dual Diffusion Transformer)是卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室推出的多模态扩散模型,能统一图像生成和理解任务。
模型结合连续图...
DeepMesh–清华和南洋理工推出的3D网格生成框架
AI工具百科:
DeepMesh是什么
DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架,基于强化学习和自回归变换器生成高质量的 3D 网格。
通过两项关键创新来优化网格...
WeGen–中科大联合上海交大等推出的统一多模态生成模型
AI工具百科:
WeGen是什么
WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉生成任务。
WeGen结合...
GPTimage1–OpenAI推出的最新图像生成模型
AI工具百科:
GPTimage1是什么
GPTimage1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功...
Veo3–谷歌推出的新一代视频生成模型
AI工具百科:
Veo 3是什么
Veo 3是谷歌I/O开发者大会上发布的新一代视频生成模型。Veo 3是谷歌首个可生成视频背景音效的模型,能合成画面,能为鸟鸣、街头交通等场景配上相应的音效,...
NexusGen–魔搭联合华东师范等机构开源的全模态图像生成模型
AI工具百科:
NexusGen是什么
NexusGen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型,支持同时完成图像理解、生成和编辑任务。NexusGen融合强大的语言模型与扩散模型的...
Dia–开源文本转语音模型,支持生成自然逼真的对话语音
AI工具百科:
Dia是什么
Dia 是 Nari Labs 推出的开源文本转语音(TTS)模型,拥有 16亿参数,根据文本脚本直接生成高度逼真的对话语音,支持多说话者标记、情感语调控制以及非语言提...
TokenSwift–超长文本生成加速框架,90分钟内生成10万Token文本
AI工具百科:
TokenSwift是什么
TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,相比传统自回归模型的近5小时,速度提升了3...
Desearch–AI深度研究工具,自动梳理研究思路生成研究框架
AI工具百科:
Desearch是什么
Desearch是专注于深度研究和智能分析的平台,帮助用户高效获取有价值的信息并精准建立研究框架。平台提供了多种研究模式,包括普通模式、深度模式和专家...
CustomSVG–Adobe联合香港城市大学推出的SVG定制生成框架
AI工具百科:
CustomSVG是什么
CustomSVG 是Adobe和香港城市大学推出的两阶段风格的SVG定制生成框架,基于文本提示生成具有定制风格的高质量 SVG 图形。
框架推出一种两阶段的生成...