FlowGram–字节跳动开源的可视化工作流搭建引擎
AI工具百科:
FlowGram是什么
FlowGram是字节跳动开源的基于节点编辑的可视化工作流搭建引擎,帮助开发者快速构建固定布局或自由连线布局的工作流。支持两种布局模式:固定布局适合顺...
AGUI–AIAgent与前端应用交互的开源协议
AI工具百科:
AGUI是什么
AGUI(AgentUser Interaction Protocol)是开源的、轻量级的、基于事件的协议,支持标准化AI Agent 与前端应用之间的交互。AGUI定义16种标准事件类型,支持SS...
Chat2SVG–文本描述实现高质量矢量图形的生成框架
AI工具百科:
Chat2SVG是什么
Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言模型(LLMs)和图像扩散模型,实现高质量 SVG 图形的自动化创作。通过多阶段流程,首...
SkyworkR1V–昆仑万维开源的多模态思维链推理模型
AI工具百科:
Skywork R1V是什么
Skywork R1V是昆仑万维开源的首款工业界多模态思维链推理模型,具备强大的视觉链式推理能力。Skywork R1V能对视觉输入进行多步逻辑推理,解决复杂的视...
PlaywrightMCP–微软推出的AI浏览器自动化工具
AI工具百科:
Playwright MCP是什么
Playwright MCP 是微软推出的轻量级浏览器自动化工具,基于 Model Context Protocol (MCP) 协议。工具基于 Playwright 的可访问性树实现与网页的交...
BabelDOC–开源AIPDF翻译工具,专为科学论文翻译设计
AI工具百科:
BabelDOC是什么
BabelDOC 是开源的智能 PDF 翻译工具,专为科学论文翻译设计。能在原文旁生成翻译文本,形成双语对照,无需切换窗口,方便阅读。能完整保留数学公式、表...
BLIP3o–SalesforceResearch等机构推出的多模态模型
AI工具百科:
BLIP3o是什么
BLIP3o是Salesforce Research等机构推出的创新多模态模型,融合自回归模型的推理和指令遵循能力及扩散模型的强大生成能力。模型基于扩散语义丰富的CLIP图像...
PokeeAI–通用AIAgent开发平台,灵活调用各种工具
AI工具百科:
Pokee AI是什么
Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习(RL)技术构建高效、个性化且交互性强的 AI Agent,替代传统大语言模型进行任务规划和工具...
MistralSmall3.1–MistralAI开源的多模态AI模型
AI工具百科:
Mistral Small 3.1是什么
Mistral Small 3.1 是 Mistral AI 开源的多模态人工智能模型,有 240 亿参数,基于 Apache 2.0 许可证发布。在文本和多模态任务上表现出色,支...
HumanRig–阿里高德推出的3D人形角色自动绑定任务数据集
AI工具百科:
HumanRig是什么
HumanRig 是阿里巴巴团队开发的 3D 人形角色自动绑定研究项目。解决现有绑定技术因缺乏高质量数据集而发展受限的问题,通过提供大规模、高质量的数据集和...
COMET–字节开源的通信优化系统
AI工具百科:
COMET是什么
COMET是字节跳动推出的针对MixtureofExperts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题。基于细粒度的计算通信重叠技术,COMET将通信与...
HoloTime–北大联合鹏城实验室推出的全景4D场景生成框架
AI工具百科:
HoloTime是什么
HoloTime 是北京大学深圳研究生院和鹏城实验室推出的全景 4D 场景生成框架,基于视频扩散模型将单张全景图像转化为具有真实动态效果的全景视频,进一步重...

