SkyworkVLReward–SkyworkAI开源的多模态奖励模型
AI工具百科:
SkyworkVL Reward是什么
SkyworkVL Reward是Skywork AI开源的多模态奖励模型,能为多模态理解和推理任务提供可靠的奖励信号。模型基于Qwen2.5VL7BInstruct架构,基于添加...
万相首尾帧模型–阿里通义开源的首尾帧生视频模型
AI工具百科:
万相首尾帧模型是什么
万相首尾帧模型(Wan2.1FLF2V14B)是开源的14B参数规模的首尾帧生视频模型。模型根据用户提供的首帧和尾帧图像,自动生成流畅的高清视频过渡效果,...
MAGI1–SandAI开源的首个自回归视频生成模型
AI工具百科:
MAGI1是什么
MAGI1 是 Sand AI 开源的全球首个自回归视频生成大模型,采用自回归架构,通过逐块预测视频序列生成流畅自然的视频,支持无限扩展和一镜到底的长视频生成。
...
SkyworkOR1–昆仑万维开源的高性能系列推理模型
AI工具百科:
SkyworkOR1是什么
SkyworkOR1(Open Reasoner 1)是昆仑万维推出的开源高性能推理模型系列,模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。SkyworkOR1包含三款模...
Cobra–清华、港中文和腾讯开源的漫画线稿上色框架
AI工具百科:
Cobra是什么
Cobra(Efficient Line Art COlorization with BRoAder References)是清华大学、香港中文大学和腾讯ARC实验室推出的漫画线稿上色框架,专为高精度、高效率...
NewsAgents–开源的终端新闻聚合与摘要系统
AI工具百科:
News Agents是什么
News Agents基于终端的新闻聚合与摘要系统。基于Amazon Q CLI作为 Agent 框架,用Model Context Protocol (MCP)解析RSS新闻源,借助tmux实现终端分...
AutoGLM沉思–首个免费、具备深度研究和操作能力的AIAgent
AI工具百科:
AutoGLM沉思是什么
AutoGLM沉思是智谱推出的首个免费、具备深度研究和操作能力的AI Agent,能模拟人类思维过程,处理复杂的开放式问题。AutoGLM沉思具备强大的推理能力和...
BILIVE–开源AI录播工具,一站式自动直播录制与处理
AI工具百科:
BILIVE是什么
BILIVE 是基于 AI 技术的开源工具,专为 B 站直播录制与处理设计。工具支持自动录制直播、渲染弹幕和字幕,支持语音识别、自动切片精彩片段,生成有趣的标...
mrge–AI代码审查平台,自动审核代码识别问题
Ai工具百科:
mrge是什么
mrge 是高效智能的 AI 代码审查平台,专为提升开发团队的代码质量和审查效率设计。通过 AI 自动审核代码,快速发现潜在缺陷、安全漏洞和性能问题,显著节省开...
FLite–Freepik联合FAL开源的文生图模型
AI工具百科:
FLite是什么
FLite是Freepik团队联合FAL开源的10B参数的文生图模型。基于Freepik内部80M有版权的数据集训练,支持商业用途。FLite将T5XXL作为文本编码器,基于抽取第17层...
TesserAct–AI4D具身世界模型,能预测3D场景的动态演变
AI工具百科:
TesserAct是什么
TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGBDN(RGB、深度和法线)视频数据来学习,超越...
ProxyLite–开源视觉语言模型,支持自动化网页任务
AI工具百科:
Proxy Lite是什么
Proxy Lite 是开源的轻量级视觉语言模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器,完成网页交互、数据抓取、表单...

