WeGen–中科大联合上海交大等推出的统一多模态生成模型
AI工具百科:
WeGen是什么
WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉生成任务。
WeGen结合...
SpatialVLA–上海AILab联合上科大等推出的空间具身通用操作模型
AI工具百科:
SpatialVLA是什么
SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构共同推出的新型空间具身通用操作模型,基于百万真实数据预训练,为机器人赋予...
StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(VideoLLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减...
ReasonIR8B–MetaAI推出专为推理密集型检索任务设计的模型
AI工具百科:
ReasonIR8B是什么
ReasonIR8B 是 Meta AI 推出的专为推理密集型检索任务设计的模型。基于 LLaMA3.18B 训练,采用双编码器架构,将查询和文档分别编码为嵌入向量,通过余...
MCPServers–字节跳动推出的大模型生态广场
AI工具百科:
MCP Servers是什么
MCP Servers是字节跳动推出的大模型生态广场,为开发者提供高效、灵活的大模型开发与部署环境。结合MCP Market、火山方舟和Trae开发环境,实现从工具...
OpenSora2.0–潞晨科技开源的AI视频生成模型
AI工具百科:
OpenSora 2.0是什么
OpenSora 2.0 是潞晨科技推出的全新开源SOTA(StateoftheArt)视频生成模型。OpenSora 2.0 用 20 万美元(224 张 GPU)成功训练出 11B 参数的商业级...
LangManus–AI自动化框架,多智能体协同完成复杂任务
AI工具百科:
LangManus是什么
LangManus 是 AI 自动化框架,基于分层多智能体系统设计。包含多种智能体,如协调员、规划员、研究员、程序员等,各司其职,协同完成复杂任务。
框架...
MultiSWEbench–字节豆包开源的多语言代码修复基准
Ai工具百科:
MultiSWEbench是什么
MultiSWEbench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWEbench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeS...
Dia–开源文本转语音模型,支持生成自然逼真的对话语音
AI工具百科:
Dia是什么
Dia 是 Nari Labs 推出的开源文本转语音(TTS)模型,拥有 16亿参数,根据文本脚本直接生成高度逼真的对话语音,支持多说话者标记、情感语调控制以及非语言提...
NexusGen–魔搭联合华东师范等机构开源的全模态图像生成模型
AI工具百科:
NexusGen是什么
NexusGen 是魔搭团队、华东师范大学等机构推出的开源全能图像生成模型,支持同时完成图像理解、生成和编辑任务。NexusGen融合强大的语言模型与扩散模型的...
TokenSwift–超长文本生成加速框架,90分钟内生成10万Token文本
AI工具百科:
TokenSwift是什么
TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本,相比传统自回归模型的近5小时,速度提升了3...
UniFluid–谷歌联合麻省理工推出的多模态图像生成与理解框架
AI工具百科:
UniFluid是什么
UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连续视觉标记处理多模态图像和文本输入,生成...

