AI软件工具学习大全 | 功能与应用全解析 - 黑喵大叔 - AI视频教程 | AI自动化工作流定制服务 | AI培训学习平台 | 黑喵大叔

3DVTON–阿里达摩院联合浙大等推出的视频虚拟试穿框架

3DVTON–阿里达摩院联合浙大等推出的视频虚拟试穿框架

AI工具百科： 3DVTON是什么 3DVTON（Textured 3DGuided Consistent Video Tr...

GigaTok–港大联合字节推出用于自回归图像生成的视觉分词器

GigaTok–港大联合字节推出用于自回归图像生成的视觉分词器

AI工具百科： GigaTok是什么 GigaTok 是用于自回归图像生成的视觉分词器，参...

UniTok–字节联合港大、华中科技推出的统一视觉分词器

UniTok–字节联合港大、华中科技推出的统一视觉分词器

AI工具百科： UniTok是什么 UniTok 是字节跳动联合香港大学和华中科技大学推...

GPDiT–清华北大联合阶跃星辰等推出的视频生成模型

GPDiT–清华北大联合阶跃星辰等推出的视频生成模型

AI工具百科： GPDiT是什么 GPDiT（Generative Pretrained Autoregressive Di...

StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架

StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架

AI工具百科： StreamBridge是什么 StreamBridge 是苹果公司与复旦大学联合推...

Eagle2.5–英伟达推出的视觉语言模型

Eagle2.5–英伟达推出的视觉语言模型

AI工具百科： Eagle 2.5是什么 Eagle 2.5是英伟达推出的视觉语言模型，专注...

PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型

PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型

AI工具百科： Pixel Reasoner是什么 Pixel Reasoner是滑铁卢大学、香港科技...

DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架

DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架

AI工具百科： DanceGRPO是什么 DanceGRPO 是字节跳动 Seed 和香港大学联合推...

NEXUSO–多模态AI模型，实现对语言、音频和视觉全方位感知与交互

NEXUSO–多模态AI模型，实现对语言、音频和视觉全方位感知与交互

AI工具百科： NEXUSO是什么 NEXUSO 是HiThink 研究院、英国帝国理工学院、浙...

Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架

Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架

AI工具百科： Vid2World是什么 Vid2World是清华大学联合重庆大学推出的创新...

WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型

WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型

AI工具百科： WebSSL是什么 WebSSL（Webscale SelfSupervised Learning）是M...

VideoT1–清华联合腾讯推出的视频生成技术

VideoT1–清华联合腾讯推出的视频生成技术

AI工具百科： VideoT1是什么 VideoT1 是清华大学和腾讯的研究人员共同推出的...

升级VIP
返回顶部

戳我👆下载：全球AI领域大咖课、AI全能商业技能教程、国外大神AI商业课...