BlockDance–复旦联合字节推出的扩散模型加速方法
AI工具百科:
BlockDance是什么
BlockDance 是复旦大学联合字节跳动智能创作团队推出的用在加速扩散模型的新方法。BlockDance 基于识别重用相邻时间步中结构相似的时空特征(STSS),...
WebThinker–人民大学联合智源研究院等机构推出的深度研究智能体
AI工具百科:
WebThinker是什么
WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自...
GenieStudio–智元机器人推出的具身智能一站式开发平台
AI工具百科:
Genie Studio是什么
Genie Studio 是智元机器人推出的具身智能一站式开发平台,覆盖数据采集、模型训练、仿真评测到模型推理的全链路。Genie Studio支持高效采集海量数据...
VideoPainter–港中文联合腾讯等机构推出的视频修复和编辑框架
AI工具百科:
VideoPainter是什么
VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基...
MedReason–美国加州联合南洋理工等机构推出的医学推理框架
AI工具百科:
MedReason是什么
MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs...
TripoSR–StabilityAI联合VAST开源的3D生成模型
AI工具百科:
TripoSR是什么
TripoSR是Stability AI和VAST联合推出的开源3D生成模型,能在不到0.5秒内从单张2D图像快速生成高质量的3D模型。模型基于Transformer架构,采用了大型重建...
FlowGram–字节跳动开源的可视化工作流搭建引擎
AI工具百科:
FlowGram是什么
FlowGram是字节跳动开源的基于节点编辑的可视化工作流搭建引擎,帮助开发者快速构建固定布局或自由连线布局的工作流。支持两种布局模式:固定布局适合顺...
AGUI–AIAgent与前端应用交互的开源协议
AI工具百科:
AGUI是什么
AGUI(AgentUser Interaction Protocol)是开源的、轻量级的、基于事件的协议,支持标准化AI Agent 与前端应用之间的交互。AGUI定义16种标准事件类型,支持SS...
Chat2SVG–文本描述实现高质量矢量图形的生成框架
AI工具百科:
Chat2SVG是什么
Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言模型(LLMs)和图像扩散模型,实现高质量 SVG 图形的自动化创作。通过多阶段流程,首...
SkyworkR1V–昆仑万维开源的多模态思维链推理模型
AI工具百科:
Skywork R1V是什么
Skywork R1V是昆仑万维开源的首款工业界多模态思维链推理模型,具备强大的视觉链式推理能力。Skywork R1V能对视觉输入进行多步逻辑推理,解决复杂的视...
PlaywrightMCP–微软推出的AI浏览器自动化工具
AI工具百科:
Playwright MCP是什么
Playwright MCP 是微软推出的轻量级浏览器自动化工具,基于 Model Context Protocol (MCP) 协议。工具基于 Playwright 的可访问性树实现与网页的交...
BabelDOC–开源AIPDF翻译工具,专为科学论文翻译设计
AI工具百科:
BabelDOC是什么
BabelDOC 是开源的智能 PDF 翻译工具,专为科学论文翻译设计。能在原文旁生成翻译文本,形成双语对照,无需切换窗口,方便阅读。能完整保留数学公式、表...

