DoraCycle–新加坡国立大学推出多模态领域适应的统一生成模型
AI工具百科:
DoraCycle是什么
DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(texttoimagetotext 和 imagetotexttoimage)实现不同模...
PlanGEN–谷歌研究团队推出的多智能体框架
AI工具百科:
PlanGEN是什么
PlanGEN 是谷歌研究团队推出的多智能体框架,通过多智能体协作、约束引导和算法自适应选择,解决复杂问题的规划和推理。
包含三个关键组件:约束智能体...
GO1–智元机器人推出的首个通用具身基座模型
AI工具百科:
GO1是什么
GO1(Genie Operator1,智元启元大模型)是智元机器人推出的首个通用具身基座模型。模型采用VisionLanguageLatentAction(ViLLA)架构,由VLM(多模态大模型)...
WorldPM–阿里Qwen团队联合复旦推出的偏好建模模型系列
AI工具百科:
WorldPM是什么
WorldPM(World Preference Modeling)是阿里巴巴集团的Qwen团队和复旦大学推出的偏好建模模型系列。基于大规模训练揭示偏好模型的可扩展性。模型基于1500...
CosmosReason1–NVIDIA推出的系列多模态大语言模型
AI工具百科:
CosmosReason1是什么
CosmosReason1 是NVIDIA推出的系列多模态大语言模型,模型能生成基于物理现实的响应。CosmosReason1 包含两个模型:CosmosReason17B 和 CosmosReaso...
UniAct–清华、商汤、北大、上海AILab共同推出的具身基础模型框架
AI工具百科:
UniAct是什么
UniAct 是新型的具身基础模型框架,解决不同机器人之间行为异构性的问题。通过学习通用行为,捕捉不同机器人共享的原子行为特征,消除因物理形态和控制接口...
MTMegatronLM–摩尔线程开源的混合并行训练框架
AI工具百科:
MTMegatronLM是什么
MTMegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持 dense 模型、多模态模型及 MoE(混合...
GPT4.1–OpenAI推出新一代语言模型,支持百万token上下文
AI工具百科:
GPT4.1是什么
GPT4.1 是 OpenAI 最新推出的新一代语言模型,包含 GPT4.1、GPT4.1 mini 和 GPT4.1 nano 三个版本。系列模型在编码能力、指令遵循和长文本处理等方面有显著...
Gemini2.0Flash–Google推出的多模态AI模型
AI工具百科:
Gemini 2.0 Flash是什么
Gemini 2.0 Flash是Google推出的多模态AI模型,结合文本理解和图像生成能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保...
Miras–谷歌推出的深度学习架构设计通用框架
AI工具百科:
Miras是什么
Miras是谷歌推出的用在深度学习架构设计的通用框架,特别是序列建模任务。Miras基于关联记忆和注意力偏差的概念,将Transformer、现代线性RNN等模型重新定义...
FourierN1–傅利叶推出的首款开源人形机器人
AI工具百科:
Fourier N1是什么
Fourier N1 是通用机器人公司傅利叶发布的首款开源人形机器人。身高1.3米,体重38公斤,拥有23个自由度,采用铝合金与工程塑料复合结构,兼具强度与灵...
Qwen2.5Omni–阿里开源的端到端多模态模型
AI工具百科:
Qwen2.5Omni是什么
Qwen2.5Omni 是阿里开源的 Qwen 系列旗舰级多模态模型,拥有7B参数,Qwen2.5Omni具备强大的多模态感知能力,能处理文本、图像、音频和视频输入,支持...

