所有分类
  • 所有分类
  • AI工具
  • AI提示词
  • 课程资源

AI工具百科: GuideGeek是什么 GuideGeek 是 Matador Network 开发的AI旅行助手,为用户提供高效、个性化的旅行规划服务。基于 OpenAI 技术,通过 WhatsApp、Instagram 和 Facebook Me...
99

AI工具百科: SmolDocling是什么 SmolDocling(SmolDocling256Mpreview )是高效轻量级的多模态文档处理模型。能将文档图像端到端地转换为结构化文本,支持文本、公式、图表等多种元素...
75

AI工具百科: WeGen是什么 WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉生成任务。 WeGen结合...
90

AI工具百科: EvDeblurVSR是什么 EvDeblurVSR是中国科学技术大学、合肥综合性国家科学中心人工智能研究所和新加坡国立大学联合推出的视频画面增强模型,能从低分辨率且模糊的视频输入中...
89

AI工具百科: Tough Tongue AI 2.0是什么 Tough Tongue AI 2.0 是多模态对话练习工具,帮助用户应对各种困难对话场景而设计。支持创建和分享多种对话场景,如面试、职场沟通、销售谈判...
66

AI工具百科: ReasonIR8B是什么 ReasonIR8B 是 Meta AI 推出的专为推理密集型检索任务设计的模型。基于 LLaMA3.18B 训练,采用双编码器架构,将查询和文档分别编码为嵌入向量,通过余...
72

AI工具百科: GPTimage1是什么 GPTimage1是OpenAI推出的原生多模态图像生成模型,基于API向开发者开放使用。模型根据文本提示和图像生成高质量、专业级的图像,支持多种风格和自定义功...
65

AI工具百科: Veo 3是什么 Veo 3是谷歌I/O开发者大会上发布的新一代视频生成模型。Veo 3是谷歌首个可生成视频背景音效的模型,能合成画面,能为鸟鸣、街头交通等场景配上相应的音效,...
74

AI工具百科: ShotAdapter是什么 ShotAdapter是Adobe联合UIUC推出的用在文本到多镜头视频生成的框架,基于微调预训练的文本到视频模型,引入过渡标记和局部注意力掩码策略,实现对多镜...
60

AI工具百科: Eagle 2.5是什么 Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现...
64

Ai工具百科: MultiSWEbench是什么 MultiSWEbench 是字节跳动豆包大模型团队开源的首个多语言代码修复基准。在SWEbench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeS...
82

AI工具百科: StreamBridge是什么 StreamBridge 是苹果公司与复旦大学联合推出的端侧视频大语言模型(VideoLLMs)框架,能帮助 AI 实时理解直播流视频。框架基于内存缓冲区和轮次衰减...
63
加入AI学习第一站,精选2025年,AI工具、提示词、变现教程。 【戳我查看 】资料目录 【戳我登录】获取资料
显示验证码
没有账号?注册  忘记密码?