UniFluid–谷歌联合麻省理工推出的多模态图像生成与理解框架
AI工具百科:
UniFluid是什么
UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成...
ZeroSearch–阿里通义开源的大模型搜索引擎框架
AI工具百科:
ZeroSearch是什么
ZeroSearch 是阿里巴巴通义实验室开源的创新大模型搜索引擎框架,基于强化学习激励大模型的搜索能力,无需与真实搜索引擎交互。框架爱基于大模型预训练...
OlympicArena–上海交大联合AILab等推出的多学科认知推理基准测试框架
AI工具百科:
OlympicArena是什么
OlympicArena是上海交通大学、上海AI Lab、苏州大学和上海交通大学生成式人工智能实验室(GAIR Lab)联合推出的多学科认知推理基准测试框架。
Oly...
APB–清华联合腾讯等机构推出的分布式长上下文推理框架
AI工具百科:
APB是什么
APB(Accelerating Distributed LongContext Inference by Passing Compressed Context Blocks across GPUs)是清华大学等机构联合提出的分布式长上下文推理框...
Liquid–华中科技、字节、港大联合推出的统一多模态生成框架
AI工具百科:
Liquid是什么
Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token,与文本token共享同一词汇空间,让大...
DeepSeekGRM–DeepSeek联合清华推出的通用奖励模型
AI工具百科:
DeepSeekGRM是什么
DeepSeekGRM是DeepSeek和清华大学研究者共同提出的通用奖励模型(Generalist Reward Modeling)。
通过点式生成式奖励建模(Pointwise Generative ...
XFusion–加州大学联合Adobe等机构推出的多模态融合框架
AI工具百科:
XFusion是什么
XFusion 是加州大学洛杉矶分校、威斯康星大学麦迪逊分校和 Adobe Research 联合提出的多模态融合框架,将预训练的大型语言模型(LLMs)扩展到多模态任务中...
NextGenAI–OpenAI推出的教育联盟,联合15家顶尖大学和机构
AI工具百科:
NextGenAI是什么
NextGenAI是OpenAI推出的全球性联盟,基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、麻省理工学院、牛津大学等在内的15所顶尖大学和机构...
FractalGenerativeModels–麻省理工推出的分形生成模型
AI工具百科:
Fractal Generative Models是什么
Fractal Generative Models(分形生成模型)是麻省理工学院计算机科学与人工智能实验室和Google DeepMind团队推出的新型图像生成方法。...
PixelReasoner–滑铁卢联合港科大等高校推出的视觉语言模型
AI工具百科:
Pixel Reasoner是什么
Pixel Reasoner是滑铁卢大学、香港科技大学、中国科学技术大学等机构推出的视觉语言模型(VLM),基于像素空间推理增强模型对视觉信息的理解和推理...
DanceGRPO–字节Seed联合港大推出的统一视觉生成强化学习框架
AI工具百科:
DanceGRPO是什么
DanceGRPO 是字节跳动 Seed 和香港大学联合推出的首个统一视觉生成强化学习框架。将强化学习应用在视觉生成领域,覆盖两大生成范式(diffusion 和 recti...
DoraCycle–新加坡国立大学推出多模态领域适应的统一生成模型
AI工具百科:
DoraCycle是什么
DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(texttoimagetotext 和 imagetotexttoimage)实现不同模...

