MIDI–AI3D场景生成技术,能将单张图像转化为360度3D场景
AI工具百科:
MIDI是什么
MIDI(MultiInstance Diffusion for Single Image to 3D Scene Generation)是先进的3D场景生成技术,能在短时间内将单张图像转化为高保真度的3D场景。通过智...
URM–阿里妈妈推出的世界知识大模型
AI工具百科:
URM是什么
URM(Universal Recommendation Model)是阿里妈妈推出的世界知识大模型,基于知识注入和信息对齐,将LLM的通用知识与电商领域的专业知识相结合,解决传统LLM...
Scenethesis–英伟达推出的交互式3D场景生成框架
AI工具百科:
Scenethesis是什么
Scenethesis 是 NVIDIA 推出的创新框架,用在从文本生成交互式 3D 场景。框架结合大型语言模型(LLM)和视觉感知技术,基于多阶段流程实现高效生成,...
Bolt3D–牛津大学联合谷歌推出的3D场景生成技术
AI工具百科:
Bolt3D是什么
Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,是潜在扩散模型,能在单个 GPU 上,仅需不到七秒的时间,直接从...
TesserAct–AI4D具身世界模型,能预测3D场景的动态演变
AI工具百科:
TesserAct是什么
TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGBDN(RGB、深度和法线)视频数据来学习,超越...
Aether–上海AILab开源的生成式世界模型
AI工具百科:
Aether是什么
Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测...
3DTown–哥伦比亚联合CybeverAI等推出单视图生成3D城镇场景的框架
AI工具百科:
3DTown是什么
3DTown 是哥伦比亚大学联合Cybever AI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输入图像分解为重叠区域...
Flow–谷歌推出的AI电影制作工具
AI工具百科:
Flow是什么
Flow是谷歌推出的AI电影制作工具,整合了Veo 3、Imagen 4和Gemini 2.5等多个AI模型,能根据文本提示生成完整的电影场景或短片,保持连贯性。
用户可以通过...
灵动AI
AI图像工具,免费增值,专业的AI商品图生成工具
官网:https://www.redoon.cn/
灵动AI是由灵动无限科技推出的一款AI商品图生成工具,用户只需上传商品图片,选择喜欢的场景,即可...