PixelHacker–华中科技联合VIVO推出的图像修复模型
AI工具百科:
PixelHacker是什么
PixelHacker 是华中科技大学和 VIVO AI Lab联合推出的图像修复(Image Inpainting)模型。基于引入潜在类别引导(Latent Categories Guidance, LCG)...
SuperEdit–字节跳动等机构推出的图像编辑方法
AI工具百科:
SuperEdit是什么
SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和效果。S...
WorldMem–南洋理工联合北大和上海AILab推出的世界生成模型
AI工具百科:
WorldMem是什么
WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制,解决传统世界生成模型在长时序下缺乏一致性的关键...
WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型
AI工具百科:
WebSSL是什么
WebSSL(Webscale SelfSupervised Learning)是Meta、纽约大学等机构推出的视觉自监督学习(SSL)系列模型,基于大规模网络数据(如数十亿图像)训练视觉模...
VideoT1–清华联合腾讯推出的视频生成技术
AI工具百科:
VideoT1是什么
VideoT1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(TestTime Scaling,TTS)提升视频生成的质量和一致性。传统视频生成模型在...
DINOXSeek–IDEA研究院推出的多模态目标检测模型
AI工具百科:
DINOXSeek是什么
DINOXSeek 是 IDEA 研究院推出的多模态目标检测模型,结合视觉感知和自然语言理解能力。DINOXSeek基于复杂的语言描述精准定位图像中的目标,识别目标的...
HealthBench–OpenAI推出的开源医疗测试基准
AI工具百科:
HealthBench是什么
HealthBench是OpenAI推出的开源医疗测试基准,用在评估大型语言模型(LLMs)在医疗保健领域的表现和安全性。HealthBench包含5000个模型与用户或医疗专...
OpenMemoryMCP–基于MCP协议的本地AI记忆共享工具
AI工具百科:
OpenMemory MCP是什么
OpenMemory MCP 是mem0推出的基于开放模型上下文协议(MCP)构建的开源工具,能解决 AI 工具记忆痛点,实现不同工具间共享上下文信息。
OpenMem...
WorldScore–斯坦福大学推出的世界生成模型统一评估基准
AI工具百科:
WorldScore是什么
WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实...
ReasonGraph–开源可视化与分析LLMs推理过程的AI工具
AI工具百科:
ReasonGraph是什么
ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、OpenAI、Google 等)...
OmniTalker–阿里推出的实时文本驱动说话头像生成框架
AI工具百科:
OmniTalker是什么
OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音响应。
核...
SimpleAR–复旦大学联合字节Seed团队推出的图像生成模型
AI工具百科:
SimpleAR是什么
SimpleAR 是复旦大学视觉与学习实验室和字节 Seed 团队联合推出的纯自回归图像生成模型。采用简洁的自回归架构,通过优化训练和推理过程,实现了高质量的...

