DeepMesh–清华和南洋理工推出的3D网格生成框架
AI工具百科:
DeepMesh是什么
DeepMesh 是清华大学和南洋理工大学研究人员提出的 3D 网格生成框架,基于强化学习和自回归变换器生成高质量的 3D 网格。
通过两项关键创新来优化网格...
网易见外
AI语言翻译,免费试用,网易推出的AI智能翻译平台,支持音视频、文档、图片、字幕等翻译
官网:https://sight.youdao.com
网易见外是由网易的人工智能事业部研发,是一个集视频听...
EvDeblurVSR–中科大等机构推出的视频画面增强模型
AI工具百科:
EvDeblurVSR是什么
EvDeblurVSR是中国科学技术大学、合肥综合性国家科学中心人工智能研究所和新加坡国立大学联合推出的视频画面增强模型,能从低分辨率且模糊的视频输入中...
ezsiteAI–零代码AI驱动的网站与应用构建平台
Ai工具百科:
ezsite AI是什么
ezsite AI 是无代码AI工具,能快速生成专业网站和应用。用户只需输入简单指令,如“创建一个咖啡店网站”,系统能在60秒内生成一个功能完备的网站,支持支...
WeGen–中科大联合上海交大等推出的统一多模态生成模型
AI工具百科:
WeGen是什么
WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉生成任务。
WeGen结合...
ShotAdapter–Adobe联合UIUC推出的多镜头视频生成框架
AI工具百科:
ShotAdapter是什么
ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架,基于微调预训练的文本到视频模型,引入过渡标记和局部注意力掩码策略,实现对多镜...
Veo3–谷歌推出的新一代视频生成模型
AI工具百科:
Veo 3是什么
Veo 3是谷歌I/O开发者大会上发布的新一代视频生成模型。Veo 3是谷歌首个可生成视频背景音效的模型,能合成画面,能为鸟鸣、街头交通等场景配上相应的音效,...
SpatialVLA–上海AILab联合上科大等推出的空间具身通用操作模型
AI工具百科:
SpatialVLA是什么
SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,为机器人赋予...
KuliKuli–AI翻译应用,能即时翻译多种语言的菜单
Kuli Kuli是什么
Kuli Kuli 是为旅行者和美食爱好者设计的AI翻译应用。Kuli Kuli 能即时翻译多种语言的菜单,包括手写菜单,帮助用户轻松了解菜品内容。Kuli Kuli 提供过敏原信息、菜品...
StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(VideoLLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减...
ToughTongueAI2.0–AI对话练习工具,具备多模态交互、智能对话模拟
AI工具百科:
Tough Tongue AI 2.0是什么
Tough Tongue AI 2.0 是多模态对话练习工具,帮助用户应对各种困难对话场景而设计。支持创建和分享多种对话场景,如面试、职场沟通、销售谈判...
GPTimage1–OpenAI推出的最新图像生成模型
AI工具百科:
GPTimage1是什么
GPTimage1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功...

