GLM432B–智谱开源的新一代基座模型
AI工具百科:
GLM432B是什么
GLM432B是智谱公司开源的新一代基座模型,参数版本为GLM432B0414。GLM432B经过15T高质量数据预训练,强化代码生成、推理和工程任务能力,支持HTML、CSS、J...
Dolphin–字节跳动开源的文档解析大模型
AI工具百科:
Dolphin是什么
Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点...
GPDiT–清华北大联合阶跃星辰等推出的视频生成模型
AI工具百科:
GPDiT是什么
GPDiT(Generative Pretrained Autoregressive Diffusion Transformer)是北京大学、清华大学、StepFun公司及中国科学技术大学推出的新型视频生成模型,模型...
SpatialVLA–上海AILab联合上科大等推出的空间具身通用操作模型
AI工具百科:
SpatialVLA是什么
SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,为机器人赋予...
StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(VideoLLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减...
ReasonIR8B–MetaAI推出专为推理密集型检索任务设计的模型
AI工具百科:
ReasonIR8B是什么
ReasonIR8B 是 Meta AI 推出的专为推理密集型检索任务设计的模型。基于 LLaMA3.18B 训练,采用双编码器架构,将查询和文档分别编码为嵌入向量,通过余...
MultiSWEbench–字节豆包开源的多语言代码修复基准
Ai工具百科:
MultiSWEbench是什么
MultiSWEbench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWEbench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeS...
UniFluid–谷歌联合麻省理工推出的多模态图像生成与理解框架
AI工具百科:
UniFluid是什么
UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成...
ScaleMCP–普华永道推出的动态MCP工具检索器
AI工具百科:
ScaleMCP是什么
ScaleMCP是普华永道推出的工具选择方法,动态的为大型语言模型(LLM)Agents 配备Model Context Protocol(MCP)工具。基于自动同步工具存储系统与MCP服...
ZeroSearch–阿里通义开源的大模型搜索引擎框架
AI工具百科:
ZeroSearch是什么
ZeroSearch 是阿里巴巴通义实验室开源的创新大模型搜索引擎框架,基于强化学习激励大模型的搜索能力,无需与真实搜索引擎交互。框架爱基于大模型预训练...
OlympicArena–上海交大联合AILab等推出的多学科认知推理基准测试框架
AI工具百科:
OlympicArena是什么
OlympicArena是上海交通大学、上海AI Lab、苏州大学和上海交通大学生成式人工智能实验室(GAIR Lab)联合推出的多学科认知推理基准测试框架。
Oly...
Seed1.5VL–字节跳动Seed推出的视觉语言多模态大模型
AI工具百科:
Seed1.5VL是什么
Seed1.5VL 是字节跳动 Seed 团队最新发布的视觉语言多模态大模型,具备强大的通用多模态理解和推理能力,推理成本显著降低。模型由一个 532M 参数的视觉...

