GEN3C–NVIDIA联合多伦多大学等推出的生成式视频模型
AI工具百科:
GEN3C是什么
GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型,基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓...
hyperugc–AI驱动的UGC视频创作平台
AI工具百科:
hyperugc是什么
hyperugc 是基于人工智能技术的UGC(用户生成内容)视频创作平台,帮助用户快速生成高质量的短视频内容。通过AI虚拟形象技术,替代真人出镜,支持多种社...
BlockDance–复旦联合字节推出的扩散模型加速方法
AI工具百科:
BlockDance是什么
BlockDance 是复旦大学联合字节跳动智能创作团队推出的用在加速扩散模型的新方法。BlockDance 基于识别重用相邻时间步中结构相似的时空特征(STSS),...
月匣–百度推出的AI社交互动应用
AI工具百科:
月匣是什么
月匣是百度推出的AI互动应用,主打情感陪伴和沉浸式剧本体验。用户选择多种AI角色进行个性化对话,如温柔好友、霸道总裁或二次元角色等,享受深度情感交流。
...
WebThinker–人民大学联合智源研究院等机构推出的深度研究智能体
AI工具百科:
WebThinker是什么
WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自...
GenieStudio–智元机器人推出的具身智能一站式开发平台
AI工具百科:
Genie Studio是什么
Genie Studio 是智元机器人推出的具身智能一站式开发平台,覆盖数据采集、模型训练、仿真评测到模型推理的全链路。Genie Studio支持高效采集海量数据...
VideoPainter–港中文联合腾讯等机构推出的视频修复和编辑框架
AI工具百科:
VideoPainter是什么
VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基...
ParakeetTDT0.6B–英伟达开源的自动语音识别模型
AI工具百科:
Parakeet TDT 0.6B是什么
Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别(ASR)模型。采用FastConformer编码器和TDT解码器架构,通过预测文本标记及其持续时间加速...
Tersa–免费AI工作流构建平台,通过拖放方式连接
AI工具百科:
Tersa是什么
Tersa 是开源免费的 AI 工作流构建平台,通过简单直观的拖放界面,帮助用户快速创建和运行 AI 工作流。支持多达 77 个顶级 AI 模型,包括 GPT4o、Claude 3.5...
TripoSR–StabilityAI联合VAST开源的3D生成模型
AI工具百科:
TripoSR是什么
TripoSR是Stability AI和VAST联合推出的开源3D生成模型,能在不到0.5秒内从单张2D图像快速生成高质量的3D模型。模型基于Transformer架构,采用了大型重建...
MedReason–美国加州联合南洋理工等机构推出的医学推理框架
AI工具百科:
MedReason是什么
MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs...
QRBTF–AI二维码生成器,生成独特风格的二维码
AI工具百科:
QRBTF是什么
QRBTF 是 Latent Cat 团队推出的 AI 二维码生成器。基于生成式 AI 技术,结合 ControlNet 和 Stable Diffusion,根据用户输入的关键词和参数生成具有独特风...

