SmolDocling–轻量级的多模态文档处理模型
AI工具百科:
SmolDocling是什么
SmolDocling(SmolDocling256Mpreview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、图表等多种元素...
Veo3–谷歌推出的新一代视频生成模型
AI工具百科:
Veo 3是什么
Veo 3是谷歌I/O开发者大会上发布的新一代视频生成模型。Veo 3是谷歌首个可生成视频背景音效的模型,能合成画面,能为鸟鸣、街头交通等场景配上相应的音效,...
ReasonIR8B–MetaAI推出专为推理密集型检索任务设计的模型
AI工具百科:
ReasonIR8B是什么
ReasonIR8B 是 Meta AI 推出的专为推理密集型检索任务设计的模型。基于 LLaMA3.18B 训练,采用双编码器架构,将查询和文档分别编码为嵌入向量,通过余...
GPTimage1–OpenAI推出的最新图像生成模型
AI工具百科:
GPTimage1是什么
GPTimage1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功...
MCPServers–字节跳动推出的大模型生态广场
AI工具百科:
MCP Servers是什么
MCP Servers是字节跳动推出的大模型生态广场,为开发者提供高效、灵活的大模型开发与部署环境。结合MCP Market、火山方舟和Trae开发环境,实现从工具...
Picsman–AI图片编辑工具,提供多种智能图片处理功能
AI工具百科:
Picsman是什么
Picsman是强大的在线AI图片编辑工具,提供多种智能图片处理功能,如一键抠图换背景、消除笔、批量编辑、AI背景生成和图片变高清等。工具操作简单,适合电...
StreamBridge–苹果联合复旦推出的端侧视频大语言模型框架
AI工具百科:
StreamBridge是什么
StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(VideoLLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减...
Eagle2.5–英伟达推出的视觉语言模型
AI工具百科:
Eagle 2.5是什么
Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现...
OpenSora2.0–潞晨科技开源的AI视频生成模型
AI工具百科:
OpenSora 2.0是什么
OpenSora 2.0 是潞晨科技推出的全新开源SOTA(StateoftheArt)视频生成模型。OpenSora 2.0 用 20 万美元(224 张 GPU)成功训练出 11B 参数的商业级...
LangManus–AI自动化框架,多智能体协同完成复杂任务
AI工具百科:
LangManus是什么
LangManus 是 AI 自动化框架,基于分层多智能体系统设计。包含多种智能体,如协调员、规划员、研究员、程序员等,各司其职,协同完成复杂任务。
框架...
MultiSWEbench–字节豆包开源的多语言代码修复基准
Ai工具百科:
MultiSWEbench是什么
MultiSWEbench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWEbench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeS...
Cardamon–AI合规平台,自动解析法规文本转为合规义务
AI工具百科:
Cardamon是什么
Cardamon 是 Y Combinator 推出 AI 驱动的合规平台,专为受监管的金融机构设计,通过自动化法规映射帮助企业快速实现合规。基于人工智能技术,将复杂的法...

