所有分类
  • 所有分类
  • AI提示词
  • AI培训视频教程

AI工具百科: DoraCycle是什么 DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(texttoimagetotext 和 imagetotexttoimage)实现不同模...

AI工具百科: PlanGEN是什么 PlanGEN 是谷歌研究团队推出的多智能体框架,通过多智能体协作、约束引导和算法自适应选择,解决复杂问题的规划和推理。 包含三个关键组件:约束智能体...

AI工具百科: GO1是什么 GO1(Genie Operator1,智元启元大模型)是智元机器人推出的首个通用具身基座模型。模型采用VisionLanguageLatentAction(ViLLA)架构,由VLM(多模态大模型)...

AI工具百科: WorldPM是什么 WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500...

AI工具百科: CosmosReason1是什么 CosmosReason1 是NVIDIA推出的系列多模态大语言模型,模型能生成基于物理现实的响应。CosmosReason1 包含两个模型:CosmosReason17B 和 CosmosReaso...

AI工具百科: UniAct是什么 UniAct 是新型的具身基础模型框架,解决不同机器人之间行为异构性的问题。通过学习通用行为,捕捉不同机器人共享的原子行为特征,消除因物理形态和控制接口...

AI工具百科: MTMegatronLM是什么 MTMegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持 dense 模型、多模态模型及 MoE(混合...

AI工具百科: GPT4.1是什么 GPT4.1 是 OpenAI 最新推出的新一代语言模型,包含 GPT4.1、GPT4.1 mini 和 GPT4.1 nano 三个版本。系列模型在编码能力、指令遵循和长文本处理等方面有显著...

AI工具百科: Gemini 2.0 Flash是什么 Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保...

AI工具百科: Miras是什么 Miras是谷歌推出的用在深度学习架构设计的通用框架,特别是序列建模任务。Miras基于关联记忆和注意力偏差的概念,将Transformer、现代线性RNN等模型重新定义...

AI工具百科: Fourier N1是什么 Fourier N1 是通用机器人公司傅利叶发布的首款开源人形机器人。身高1.3米,体重38公斤,拥有23个自由度,采用铝合金与工程塑料复合结构,兼具强度与灵...

AI工具百科: Qwen2.5Omni是什么 Qwen2.5Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入,支持...
戳我👆免费下载:全球AI领域大咖课、AI全能商业技能教程、国外大神AI商业课...
显示验证码