LightLab–谷歌等机构推出的图像光源控制模型
AI工具百科:
LightLab是什么
LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。模型支持用户调整光源的强度和颜色,插入虚...
Magnitude–开源AIAgent驱动的端到端测试框架
AI工具百科:
Magnitude是什么
Magnitude 是开源的视觉 AI Agents驱动的端到端测试框架。Magnitude基于自然语言构建测试用例,用强大的推理代理规划和调整测试流程,基于快速的视觉代...
DianJinR1–阿里云通义点金联合苏大推出的金融推理大模型
AI工具百科:
DianJinR1是什么
DianJinR1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。
模型通过推理...
Voila–开源端到端语音大模型,实现低延迟语音对话
AI工具百科:
Voila是什么
Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自...
AnimeGamer–腾讯联合香港城市大学推出的动漫生活模拟系统
AI工具百科:
AnimeGamer是什么
AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型(MLLM),支持玩家基于开放式的语言指令,用动漫角色的...
RuoYiAI–全栈式AI开发平台,快速搭建个性化AI应用
AI工具百科:
RuoYi AI是什么
RuoYi AI 是全栈式 AI 开发平台,提供完整的前端、后台管理及小程序应用,支持灵活修改和分发代码。RuoYi AI 支持本地 RAG 方案,集成 Milvus/Weaviate ...
AgentTARS–字节跳动开源的多模态AIAgent项目
AI工具百科:
Agent TARS是什么
Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统无缝集成,实现复杂任务的规划与执行。Agent TA...
BlenderMCP–基于MCP集成的3D建模工具
AI工具百科:
BlenderMCP是什么
BlenderMCP是将Blender与Claude AI基于模型上下文协议(MCP)集成的工具。BlenderMCP用socket服务器实现Blender与AI的双向通信,支持创建、修改和删除3...
SurfSense–开源AI研究助手,个人知识库与全球数据源无缝链接
AI工具百科:
SurfSense是什么
SurfSense 是开源的 AI 研究工具,类似于 NotebookLM 和 Perplexity,具备更强的扩展性。工具能与多种外部数据源(如搜索引擎、Slack、Notion、YouTube...
RFDETR–Roboflow推出的实时目标检测模型
AI工具百科:
RFDETR是什么
RFDETR是Roboflow推出的实时目标检测模型。RFDETR是首个在COCO数据集上达到60+平均精度均值(mAP)的实时模型,性能优于现有的目标检测模型。
RFDETR结...
MCACtrl–中科院和中科大推出的图像定制生成框架
AI工具百科:
MCACtrl是什么
MCACtrl(Multiparty Collaborative Attention Control)是中科院计算所和中国科学院大学的推出的图像定制生成框架,基于文本和复杂视觉条件实现高质量的...
LiveCC–字节联合新加坡国立大学开源的实时视频解说模型
AI工具百科:
LiveCC是什么
LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析...

