3DVTON–阿里达摩院联合浙大等推出的视频虚拟试穿框架
AI工具百科:
3DVTON是什么
3DVTON(Textured 3DGuided Consistent Video Tr...
GigaTok–港大联合字节推出用于自回归图像生成的视觉分词器
AI工具百科:
GigaTok是什么
GigaTok 是用于自回归图像生成的视觉分词器,参...
UniTok–字节联合港大、华中科技推出的统一视觉分词器
AI工具百科:
UniTok是什么
UniTok 是字节跳动联合香港大学和华中科技大学推...
GPDiT–清华北大联合阶跃星辰等推出的视频生成模型
AI工具百科:
GPDiT是什么
GPDiT(Generative Pretrained Autoregressive Di...
StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推...
Eagle2.5–英伟达推出的视觉语言模型
AI工具百科:
Eagle 2.5是什么
Eagle 2.5是英伟达推出的视觉语言模型,专注...
PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型
AI工具百科:
Pixel Reasoner是什么
Pixel Reasoner是滑铁卢大学、香港科技...
DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架
AI工具百科:
DanceGRPO是什么
DanceGRPO 是字节跳动 Seed 和香港大学联合推...
NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新...
WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型
AI工具百科:
WebSSL是什么
WebSSL(Webscale SelfSupervised Learning)是M...
VideoT1–清华联合腾讯推出的视频生成技术
AI工具百科:
VideoT1是什么
VideoT1 是清华大学和腾讯的研究人员共同推出的...
- 1
- 2

