SkyworkVLReward–SkyworkAI开源的多模态奖励模型
AI工具百科:
SkyworkVL Reward是什么
SkyworkVL Reward是Skywork AI开源的多模态奖励模型,能为多模态理解和推理任务提供可靠的奖励信号。模型基于Qwen2.5VL7BInstruct架构,基于添加...
万相首尾帧模型–阿里通义开源的首尾帧生视频模型
AI工具百科:
万相首尾帧模型是什么
万相首尾帧模型(Wan2.1FLF2V14B)是开源的14B参数规模的首尾帧生视频模型。模型根据用户提供的首帧和尾帧图像,自动生成流畅的高清视频过渡效果,...
SkyworkOR1–昆仑万维开源的高性能系列推理模型
AI工具百科:
SkyworkOR1是什么
SkyworkOR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。SkyworkOR1包含三款模...
FLite–Freepik联合FAL开源的文生图模型
AI工具百科:
FLite是什么
FLite是Freepik团队联合FAL开源的10B参数的文生图模型。基于Freepik内部80M有版权的数据集训练,支持商业用途。FLite将T5XXL作为文本编码器,基于抽取第17层...
ChatTS14B–字节开源的时间序列理解和推理大模型
AI工具百科:
ChatTS14B是什么
ChatTS14B 是字节跳动研究团队开源的专注于时间序列理解和推理的大型语言模型,参数量达 140 亿。基于 Qwen2.514BInstruct 微调而成,通过合成数据对齐...
OpenAvatarChat–阿里开源的实时数字人对话系统
AI工具百科:
Open Avatar Chat是什么
Open Avatar Chat 是阿里开源的模块化的实时数字人对话系统,支持在单台电脑上运行完整的功能。Open Avatar Chat 支持低延迟的实时对话(平均响...
InternVL3–上海AILab开源的多模态大语言模型
AI工具百科:
InternVL3是什么
InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时...
FinR1–上海财经联合财跃星辰推出的金融推理大模型
AI工具百科:
FinR1是什么
FinR1是上海财经大学联合财跃星辰推出的首个金融领域R1类推理大模型。基于7B参数的Qwen2.57BInstruct架构,通过在金融推理场景的高质量思维链数据上进行SFT...
ParakeetTDT0.6B–英伟达开源的自动语音识别模型
AI工具百科:
Parakeet TDT 0.6B是什么
Parakeet TDT 0.6B 是英伟达推出的开源自动语音识别(ASR)模型。采用FastConformer编码器和TDT解码器架构,通过预测文本标记及其持续时间加速...
VideoPainter–港中文联合腾讯等机构推出的视频修复和编辑框架
AI工具百科:
VideoPainter是什么
VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基...
TripoSR–StabilityAI联合VAST开源的3D生成模型
AI工具百科:
TripoSR是什么
TripoSR是Stability AI和VAST联合推出的开源3D生成模型,能在不到0.5秒内从单张2D图像快速生成高质量的3D模型。模型基于Transformer架构,采用了大型重建...
MedReason–美国加州联合南洋理工等机构推出的医学推理框架
AI工具百科:
MedReason是什么
MedReason是美国加州大学圣克鲁斯分校、加拿大不列颠哥伦比亚大学、新加坡南洋理工大学等机构推出的医学推理框架,基于知识图谱提升大型语言模型(LLMs...

