DreamO–字节联合北大推出的图像定制生成框架
AI工具百科:
DreamO是什么
DreamO 是字节跳动创作团队联合北京大学深圳研究生院电子与计算机工程学院联合推出的用在图像定制生成的统一框架,基于预训练的扩散变换器(DiT)模型实现...
FourierN1–傅利叶推出的首款开源人形机器人
AI工具百科:
Fourier N1是什么
Fourier N1 是通用机器人公司傅利叶发布的首款开源人形机器人。身高1.3米,体重38公斤,拥有23个自由度,采用铝合金与工程塑料复合结构,兼具强度与灵...
Qwen2.5Omni–阿里开源的端到端多模态模型
AI工具百科:
Qwen2.5Omni是什么
Qwen2.5Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入,支持...
RightNowAI–自动分析和优化CUDA内核代码的AI平台
Ai工具百科:
RightNow AI是什么
RightNow AI 是专注于优化 CUDA 代码的 AI 平台。通过自动分析和优化 CUDA 内核代码,显著提升 GPU 性能,支持多种 NVIDIA GPU 架构,如 Ampere、Hopp...
SeniorTalk–智源联合南开开源的超高龄老年人中文对话语音数据集
AI工具百科:
SeniorTalk是什么
SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及...
MultiAgentOrchestrator–亚马逊开源的多智能体框架
AI工具百科:
MultiAgent Orchestrator是什么
MultiAgent Orchestrator 是用于管理和协调多个智能代理(Agent)的框架。通过分类器识别用户输入的意图,将请求分配给最适合的代理进行...
IMAGPose–南京理工大学推出姿态引导图像生成的统一框架
AI工具百科:
IMAGPose是什么
IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的局限性,如无法同时生成多个不同...
OpenMathNemotron–英伟达开源的数学推理系列模型
AI工具百科:
OpenMathNemotron是什么
OpenMathNemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathReaso...
PieceitTogether–BriaAI等机构推出的图像生成框架
AI工具百科:
Piece it Together是什么
Piece it Together (PiT)是Bria AI等机构推出的创新图像生成框架,专门用在从部分视觉组件生成完整的概念图像。基于特定领域的先验知识,将用...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新框架,支持将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。模型基...
DreamFit–字节联合清华和中山大学推出的虚拟试衣框架
AI工具百科:
DreamFit是什么
DreamFit是字节跳动团队联合清华大学深圳国际研究生院、中山大学深圳校区推出的虚拟试衣框架,专门用在轻量级服装为中心的人类图像生成。
框架能显著...
YuLanOneSim–人大高瓴AI团队推出的社会模拟器
AI工具百科:
YuLanOneSim是什么
YuLanOneSim(玉兰万象)是中国人民大学高瓴 AI 学院RUCGSAI团队推出的新型社会模拟器。基于大型语言模型(LLM)Agents 模拟人类社会行为,无需编程构...

