Flex.2preview–Ostris推出的文本到图像扩散模型
AI工具百科:
Flex.2preview是什么
Flex.2preview 是Ostris开源的 80 亿参数文本到图像扩散模型,支持通用控制输入(如线条、姿态、深度)和内置修复功能。模型基于一个模型满足多种创...
Instella–AMD开源的30亿参数系列语言模型
AI工具百科:
Instella是什么
Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMD Instinct™ MI300X GPU上训练而成,基于自回归Transformer架构,包含36个解码器...
Seed1.5Embedding–字节跳动Seed团队推出的向量模型
AI工具百科:
Seed1.5Embedding是什么
Seed1.5Embedding 是字节跳动 Seed 团队最新发布的向量模型,基于 Seed1.5 (Doubao1.5pro) 进一步训练。模型在权威测评榜单 MTEB 上达到了中英文...
LightLab–谷歌等机构推出的图像光源控制模型
AI工具百科:
LightLab是什么
LightLab是谷歌等机构推出的基于扩散模型的图像光源控制模型,能对单张图像中的光源进行细粒度的参数化控制。模型支持用户调整光源的强度和颜色,插入虚...
CommandA–Cohere推出的生成式AI模型
AI工具百科:
Command A是什么
Command A 是 Cohere 推出的最新生成式 AI 模型,专为企业级应用设计。Command A用高性能和低硬件成本为核心优势,能在两块 GPU 上高效部署,相比其他类...
DianJinR1–阿里云通义点金联合苏大推出的金融推理大模型
AI工具百科:
DianJinR1是什么
DianJinR1是阿里云通义点金团队与苏州大学联合推出的金融领域推理增强大模型,专为金融任务设计,融合了先进的技术和全面的数据支持。
模型通过推理...
QwQ32B–阿里通义千问开源的最新推理模型
AI工具百科:
QwQ32B是什么
QwQ32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上表现出色,性能比肩 6710 亿参数的 Deep...
Voila–开源端到端语音大模型,实现低延迟语音对话
AI工具百科:
Voila是什么
Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自...
AnimeGamer–腾讯联合香港城市大学推出的动漫生活模拟系统
AI工具百科:
AnimeGamer是什么
AnimeGamer 是腾讯 PCG 和香港城市大学共同推出的无限动漫生活模拟系统。基于多模态大语言模型(MLLM),支持玩家基于开放式的语言指令,用动漫角色的...
LiveCC–字节联合新加坡国立大学开源的实时视频解说模型
AI工具百科:
LiveCC是什么
LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析...
TripoSF–VASTAI开源的新一代3D基础模型
AI工具百科:
TripoSF是什么
TripoSF是VAST推出的新一代3D基础模型,突破传统3D建模在细节、复杂结构和扩展性上的瓶颈。采用SparseFlex表示方法,结合稀疏体素结构,仅在物体表面附近...
SkyReelsV2–昆仑万维开源的无限时长电影生成模型
AI工具百科:
SkyReelsV2是什么
SkyReelsV2是昆仑万维SkyReels团队推出的无限时长电影生成模型,基于扩散强迫(Diffusionforcing)框架,结合多模态大语言模型(MLLM)、多阶段预训练...

