Bolt3D–牛津大学联合谷歌推出的3D场景生成技术
AI工具百科:
Bolt3D是什么
Bolt3D 是谷歌研究院、牛津大学 VGG 团队和谷歌 DeepMind 联合推出的新型 3D 场景生成技术,是潜在扩散模型,能在单个 GPU 上,仅需不到七秒的时间,直接从...
MistralOCR–MistralAI推出的先进光学字符识别工具
AI工具百科:
Mistral OCR是什么
Mistral OCR 是 Mistral AI 推出的先进光学字符识别(OCR)工具,专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素,支...
InternVL–OpenGVLab推出的多模态大模型
AI工具百科:
InternVL是什么
InternVL 是上海人工智能实验室 OpenGVLab 推出的多模态大模型,专注于视觉与语言任务。采用 ViTMLPLLM 架构,通过视觉模块(如 InternViT)和语言模块(...
LBM–AI图像转换框架,实现可控阴影生成
AI工具百科:
LBM是什么
LBM(Latent Bridge Matching)是Jasper Research团队推出的新型图像到图像转换框架,基于在潜在空间中构建桥匹配实现快速高效的图像转换。LBM仅需单步推理完...
AIResearcher–香港大学推出的开源自动化科学研究工具
AI工具百科:
AIResearcher是什么
AIResearcher 是香港大学数据科学实验室推出的开源自动化科学研究工具,基于大型语言模型(LLM)代理实现从研究想法到论文发表的全流程自动化。
A...
QBot–腾讯QQ浏览器推出的全新AI浏览器
AI工具百科:
QBot是什么
QBot是腾讯QQ浏览器推出的全新AI浏览器,集成了AI搜索、浏览、办公、学习和写作等多种功能,为用户提供更智能、便捷的体验。
QBot支持多种搜索方式,包括...
HedyAI–AI会议工具,实时分析会议内容、提供实时洞察与建议
AI工具百科:
Hedy AI是什么
Hedy AI 是提升会议和对话效率的人工智能工具。能在会议、讲座、面试等场景中实时提供智能建议、谈话要点和策略性提示,帮助用户更自信地参与对话。
支...
Fellou–FellouAI推出的首个Agentic浏览器
AI工具百科:
Fellou是什么
Fellou 是AI初创公司 Fellou AI 推出的全球首个Agentic浏览器。具备传统浏览器的信息浏览功能,能智能执行复杂任务,将繁琐的点击操作转化为简单的指令。
...
NodeRAG–开源基于异构图的智能检索与生成系统
AI工具百科:
NodeRAG是什么
NodeRAG 是基于异构图的检索增强生成(RetrievalAugmented Generation,RAG)系统。通过构建包含多种节点类型的异构图,将文档信息和语言模型生成的见解整...
Sparkify–谷歌推出的AI动画视频生成工具
AI工具百科:
Sparkify是什么
Sparkify是谷歌推出的AI动画视频生成工具,基于Gemini 2.5和Veo 2模型。用户输入问题或复杂概念后,Sparkify能在2分钟内生成直观的动画短视频,讲解知识...
Pemo–AI文档管理工具,支持一键翻译智能总结文献摘要
Pemo是什么
Pemo是AI驱动的文档管理工具。工具支持PDF、Epub、Word等多种格式文档的导入与管理,具备一键翻译、智能总结、思维导图生成等功能,帮助用户快速理解复杂文献,提升阅读效率...
小卡健康–AI健康管理应用,自动识别食物热量和营养分析
AI工具百科:
小卡健康是什么
小卡健康是北京快欧科技推出的AI健康管理应用,专注于帮助用户轻松管理热量摄入与消耗。核心功能包括拍照识别热量,用户只需对食物拍照,APP能快速准确地...