rabbitOSintern–rabbit推出的通用型AI智能体
AI工具百科:
rabbitOS intern是什么
rabbitOS Intern 由 AI 初创公司 rabbit 推出的通用型AI智能体。通过协调多个智能代理(agents)来完成复杂任务,展现出类似实习生水平的人类能力...
SpatialRAG–埃默里大学等机构推出的空间推理能力框架
AI工具百科:
SpatialRAG是什么
SpatialRAG(Spatial RetrievalAugmented Generation)是美国埃默里大学、德克萨斯大学奥斯汀分校推出的用在提升大型语言模型(LLMs)空间推理能力的框...
LanDiff–浙大联合月之暗面推出的文本到视频生成混合框架
AI工具百科:
LanDiff是什么
LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,...
amis–百度开源的低代码前端框架
Ai工具百科:
amis是什么
amis 是百度开源的低代码前端框架,基于简单的 JSON 配置快速生成各种后台页面,无需编写复杂前端代码。amis支持表单、表格、图表、CRUD 操作等功能,提供丰...
StepR1VMini–阶跃星辰最新推出的多模态推理模型
AI工具百科:
StepR1VMini是什么
StepR1VMini 是阶跃星辰最新推出的多模态推理模型。支持图文输入和文字输出,具备良好的指令遵循和通用能力,能高精度感知图像完成复杂推理任务。模型...
Addsubtitle–AI视频翻译工具,自动生成时间同步的字幕
AI工具百科:
Addsubtitle是什么
Addsubtitle 是基于 AI 的在线视频编辑工具,通过智能技术为用户提供便捷的字幕添加、翻译及视频编辑服务。用户可以轻松将视频翻译成100多种语言,一...
Mogao–字节跳动Seed团队推出的多模态理解与生成统一架构
AI工具百科:
Mogao是什么
Mogao是字节跳动Seed团队推出的交错多模态生成全基础模型。在架构上采用了双视觉编码器,结合变分自编码器(VAE)和视觉变换器(ViT),能更好地进行视觉理...
Dolphin–清华联合海天瑞声推出的语音识别大模型
AI工具百科:
Dolphin是什么
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言...
gpt4otranscribe–OpenAI推出的语音转文本模型
AI工具百科:
gpt4otranscribe是什么
gpt4otranscribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,用海量多样化音频数据训练,精准捕捉语音细微差别,显著降低单...
ICEdit–浙江大学联合哈佛大学推出的指令式图像编辑框架
AI工具百科:
ICEdit是什么
ICEdit(InContext Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文感知能力...

