VITAAudio–开源的端到端多模态语音大模型,低延迟、推理快
AI工具百科:
VITAAudio是什么
VITAAudio 是开源的端到端多模态语音大模型,具有低延迟、推理速度快的特点。通过轻量级的多模态交叉标记预测(MCTP)模块,可在首次前向传播中生成音频...
AutoBE–AI驱动的后端服务器代码生成工具
Ai工具百科:
AutoBE是什么
AutoBE 是 AI 驱动的后端服务器代码生成工具,通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma 和 Postgres 等技术栈构建,强...
FramePack–斯坦福开源的AI视频生成模型
AI工具百科:
FramePack是什么
FramePack 是斯坦福大学开源的AI视频生成模型。基于压缩输入帧的上下文长度,解决视频生成中的“遗忘”和“漂移”问题,让模型能高效处理大量帧,保持较低的...
AugmentAgent–AugmentCode推出的AI编程助手
Ai工具百科:
Augment Agent是什么
Augment Agent 是Augment推出的AI编程助手,帮助软件工程师高效编写高质量代码。Augment Agent能深度理解大型代码库,随着用户工作自动学习和适应代...
LegoGPT–卡内基梅隆大学推出的乐高积木设计模型
AI工具百科:
LegoGPT是什么
LegoGPT 是卡内基梅隆大学推出的乐高积木设计模型,支持基于文本提示生成物理稳定且能构建的乐高积木模型。LegoGPT 基于自回归语言模型和大规模乐高设计数...
xbench–红杉中国推出全新的AI基准测试工具
AI工具百科:
xbench是什么
xbench是红杉中国推出全新的AI基准测试工具。基于双轨评估体系,构建多维度测评数据集,追踪模型的理论能力上限与Agent的实际落地价值。xbench用长青评估机...
交交–上海交大推出的口语对话情感大模型
AI工具百科:
交交是什么
交交是上海交通大学听觉认知与计算声学实验室推出的全球首个纯学术界自研的口语对话情感大模型。交交具备多人对话、多语言交流、方言理解、角色扮演、情感互...
EasyControl–TiamatAI联合上海科大等开源的图像生成控制框架
AI工具百科:
EasyControl是什么
EasyControl 是 Tiamat AI 开源的基于扩散变换器(Diffusion Transformer,DiT)架构的高效灵活控制框架,通过轻量级条件注入 LoRA 模块,独立处理条...
PodAgent–港中文、微软、小红书联合推出的播客生成框架
AI工具百科:
PodAgent是什么
PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富...
MoviiGen1.1–AI视频生成模型,支持生成电影级画质
AI工具百科:
MoviiGen 1.1是什么
MoviiGen 1.1 是ZulutionAI 推出的专注于生成电影级画质视频的AI模型。模型基于 Wan2.1 微调而成,经过专业电影制作人和AIGC创作者在60个美学维度上...
DreamGen–英伟达推出的新型机器人学习技术
AI工具百科:
DreamGen是什么
DreamGen是英伟达推出的创新的机器人学习技术,基于AI视频世界模型生成合成数据,让机器人能在梦境中学习新技能。DreamGen仅需少量现实视频数据,能生成...
RoboOS–智源研究院推出的首个跨本体具身大小脑协作框架
AI工具百科:
RoboOS是什么
RoboOS是智源研究院推出的首个跨本体具身大小脑协作框架。基于“大脑小脑”分层架构,具身大脑RoboBrain负责全局感知与决策,小脑技能库负责低延迟精准执行,...

