RightNowAI–自动分析和优化CUDA内核代码的AI平台
Ai工具百科:
RightNow AI是什么
RightNow AI 是专注于优化 CUDA 代码的 AI 平台。通过自动分析和优化 CUDA 内核代码,显著提升 GPU 性能,支持多种 NVIDIA GPU 架构,如 Ampere、Hopp...
SeniorTalk–智源联合南开开源的超高龄老年人中文对话语音数据集
AI工具百科:
SeniorTalk是什么
SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及...
NEXUSO–多模态AI模型,实现对语言、音频和视觉全方位感知与交互
AI工具百科:
NEXUSO是什么
NEXUSO 是HiThink 研究院、英国帝国理工学院、浙江大学、复旦大学、微软、Meta AI等机构推出的多模态AI模型,能实现对语言、音频和视觉信息的全方位感知与...
MindLLM–耶鲁联合剑桥等机构推出的医疗领域AI模型
AI工具百科:
MindLLM是什么
MindLLM 是耶鲁大学、达特茅斯学院和剑桥大学联合推出的AI模型,能将脑部功能性磁共振成像(fMRI)信号解码为自然语言文本。
MindLLM基于一个主体无关(s...
OpenMathNemotron–英伟达开源的数学推理系列模型
AI工具百科:
OpenMathNemotron是什么
OpenMathNemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathReaso...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新框架,支持将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。模型基...
DINOXSeek–IDEA研究院推出的多模态目标检测模型
AI工具百科:
DINOXSeek是什么
DINOXSeek 是 IDEA 研究院推出的多模态目标检测模型,结合视觉感知和自然语言理解能力。DINOXSeek基于复杂的语言描述精准定位图像中的目标,识别目标的...
WorldScore–斯坦福大学推出的世界生成模型统一评估基准
AI工具百科:
WorldScore是什么
WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实...
ReasonGraph–开源可视化与分析LLMs推理过程的AI工具
AI工具百科:
ReasonGraph是什么
ReasonGraph 是用在可视化和分析大语言模型(LLMs)推理过程的开源网络平台。ReasonGraph支持超过 50 种主流模型(如 Anthropic、OpenAI、Google 等)...
文心大模型4.5Turbo–百度推出的最新多模态大模型
AI工具百科:
文心大模型4.5 Turbo是什么
文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图...
RAGEN–训练大模型推理Agent的开源强化学习框架
AI工具百科:
RAGEN是什么
RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(StateThinkingActionReward Policy Optimization)框...
MineWorld–微软研究院开源的实时交互式世界模型
AI工具百科:
MineWorld是什么
MineWorld是微软研究院开源的基于《我的世界》(Minecraft)的实时交互式世界模型,基于视觉动作自回归Transformer架构,将游戏场景和动作转化为离散的t...

