LHM–阿里通义开源的单图生成可动画3D人体模型
AI工具百科:
LHM是什么
LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通义实验室推出的从单张图像重建可动画化3D人体模型。基于多模态Transformer架构,融合3D几何...
OpenUtau–开源的AI歌声合成工具,自动适配系统语言
AI工具百科:
OpenUtau是什么
OpenUtau 是开源的歌声合成工具,兼容 UTAU 音源库和重采样器,支持 VSQX 导入、多语言界面及预渲染功能,帮助创作者快速预览作品节省时间。OpenUtau现代...
GLMZ1Rumination–智谱推出的沉思模型
AI工具百科:
GLMZ1Rumination是什么
GLMZ1Rumination 是智谱推出的沉思模型,基于 GLMZ1 进一步优化而成,具体参数为GLMZ1Rumination32B0414 。GLMZ1Rumination基于扩展强化学习训练...
UniRig–清华联合VAST开源的通用自动骨骼绑定框架
AI工具百科:
UniRig是什么
UniRig是清华大学计算机系和VAST联合推出的创新自动骨骼绑定框架,用在处理复杂和多样化的3D模型。基于大型自回归模型和骨骼点交叉注意力机制,生成高质量...
ResumeMatcher–开源AI简历优化工具,解析简历和职位描述提供改进建议
AI工具百科:
Resume Matcher是什么
Resume Matcher 是开源的 AI 简历优化工具,帮助求职者提升简历通过自动化筛选系统(ATS)的概率。Resume Matcher基于解析简历和职位描述,提取关...
InfiniteYou–字节跳动开源的身份保持图像生成框架
AI工具百科:
InfiniteYou是什么
InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 InfuseNet 将身...
BrowseComp–OpenAI开源的AIAgent网络浏览能力基准
AI工具百科:
BrowseComp是什么
BrowseComp 是 OpenAI 开源的用于评估 AI Agent网络浏览能力的基准测试。包含 1266 个极具挑战性的问题,覆盖电影、科学与技术、艺术、历史、体育、音...
Hunyuan3D2.0–腾讯推出的大规模3D资产生成系统
AI工具百科:
Hunyuan3D 2.0是什么
Hunyuan3D 2.0 是腾讯推出的大规模 3D 资产生成系统,专注于从文本和图像生成高分辨率的 3D 模型。系统采用两阶段生成流程:首先生成无纹理的几何模...
Chatlog–开源AI聊天记录分析工具,自动解析、可视化和挖掘聊天记录
AI工具百科:
Chatlog是什么
Chatlog是开源的聊天记录分析工具,支持高效解析、可视化和挖掘微信、QQ、Telegram等主流聊天工具的聊天记录。工具支持从本地数据库文件获取数据,提供智...
VPP–清华和星动纪元推出的首个AIGC机器人大模型
AI工具百科:
VPP是什么
VPP(Video Prediction Policy)是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型,学习互联网上的大量视频数据,直接预测未来场景...
MiniMind–开源的AI模型训练工具,2小时训练25.8M小模型
AI工具百科:
MiniMind是什么
MiniMind 是开源的超小型语言模型项目,极低成本帮助个人开发者从零开始训练自己的语言模型。MiniMind 基于轻量级设计,最小版本仅需25.8M参数,体积仅为GP...
FastVLM–苹果推出的高效视觉语言模型
AI工具百科:
FastVLM是什么
FastVLM是苹果推出的高效的视觉语言模型(VLM),能提升高分辨率图像处理的效率和性能。模型引入FastViTHD新型混合视觉编码器,有效减少视觉token数量,显...

