所有分类
  • 所有分类
  • AI提示词
  • AI培训视频教程

AI工具百科: PixelHacker是什么 PixelHacker 是华中科技大学和 VIVO AI Lab联合推出的图像修复(Image Inpainting)模型。基于引入潜在类别引导(Latent Categories Guidance, LCG)...

AI工具百科: SuperEdit是什么 SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和效果。S...

AI工具百科: WorldMem是什么 WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制,解决传统世界生成模型在长时序下缺乏一致性的关键...

AI工具百科: WebSSL是什么 WebSSL(Webscale SelfSupervised Learning)是Meta、纽约大学等机构推出的视觉自监督学习(SSL)系列模型,基于大规模网络数据(如数十亿图像)训练视觉模...

AI工具百科: VideoT1是什么 VideoT1 是清华大学和腾讯的研究人员共同推出的视频生成技术,基于测试时扩展(TestTime Scaling,TTS)提升视频生成的质量和一致性。传统视频生成模型在...

AI工具百科: DINOXSeek是什么 DINOXSeek 是 IDEA 研究院推出的多模态目标检测模型,结合视觉感知和自然语言理解能力。DINOXSeek基于复杂的语言描述精准定位图像中的目标,识别目标的...

AI工具百科: HealthBench是什么 HealthBench是OpenAI推出的开源医疗测试基准,用在评估大型语言模型(LLMs)在医疗保健领域的表现和安全性。HealthBench包含5000个模型与用户或医疗专...

AI工具百科: OpenMemory MCP是什么 OpenMemory MCP 是mem0推出的基于开放模型上下文协议(MCP)构建的开源工具,能解决 AI 工具记忆痛点,实现不同工具间共享上下文信息。 OpenMem...

AI工具百科: WorldScore是什么 WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实...

AI工具百科: ReasonGraph是什么 ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、OpenAI、Google 等)...

AI工具百科: OmniTalker是什么 OmniTalker 是阿里巴巴发布的实时文本驱动的说话头像生成技术,能同时处理文本、图像、音频和视频等多种模态输入,以流式方式生成自然语音响应。 核...

AI工具百科: SimpleAR是什么 SimpleAR 是复旦大学视觉与学习实验室和字节 Seed 团队联合推出的纯自回归图像生成模型。采用简洁的自回归架构,通过优化训练和推理过程,实现了高质量的...
戳我👆免费下载:全球AI领域大咖课、AI全能商业技能教程、国外大神AI商业课...
显示验证码