所有分类
  • 所有分类
  • AI提示词
  • AI培训视频教程

AI工具百科: Liquid是什么 Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token,与文本token共享同一词汇空间,让大...

AI工具百科: LightR1是什么 LightR1是360智脑开源的AI模型,专注于数学领域的长思维链推理,具体为 LightR132B。模型基于Qwen2.532BInstruct,用7万条数学数据和两阶段课程学习(SFT+...

AI工具百科: TheoremExplainAgent是什么 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理系统,基于生成长篇动画视频帮助人们更好地理解数学和科学定理。Th...

AI工具百科: DeepSeekProverV2是什么 DeepSeekProverV2是深度求索团队 DeepSeek 开源的专注于数学推理的超大规模语言模型。包含两个版本:DeepSeekProverV2671B 和 DeepSeekProverV27...

AI工具百科: HiDreamI1是什么 HiDreamI1是 HiDream.ai 团队推出的开源AI图像生成模型,拥有17亿参数,采用MIT许可证。模型在图像生成质量、提示词遵循能力等方面表现出色,支持逼真、...

AI工具百科: Orpheus TTS是什么 Orpheus TTS 是基于 Llama3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生成自然、富有情感且接近人类水平的语音,具备零样本语音克隆能力,...

AI工具百科: RelightVid是什么 RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型,支持根据文本提示、...

AI工具百科: MegaTTS 3是什么 MegaTTS 3是字节跳动与浙江大学合作推出的零样本文本到语音合成系统,采用轻量级扩散模型,参数量仅0.45B,能高效生成高质量语音。系统将语音分解为内容...

AI工具百科: WorldPM是什么 WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500...

AI工具百科: StepVideoTI2V是什么 StepVideoTI2V 是阶跃星辰(StepFun)推出的开源图生视频(ImagetoVideo)生成模型,拥有 300 亿参数,能根据文本描述和图像输入生成最长 102 帧的...

AI工具百科: CosmosReason1是什么 CosmosReason1 是NVIDIA推出的系列多模态大语言模型,模型能生成基于物理现实的响应。CosmosReason1 包含两个模型:CosmosReason17B 和 CosmosReaso...

AI工具百科: GaussianCity是什么 GaussianCity 是南洋理工大学 SLab 团队推出的高效无边界3D城市生成框架,基于3D高斯绘制(3DGS)技术。引入紧凑的 BEVPoint 表示方法,将场景的显存...
戳我👆免费下载:全球AI领域大咖课、AI全能商业技能教程、国外大神AI商业课...
显示验证码