SurveyGO卷姬–清华联合面壁智能开源的AI论文写作工具
工具百科:
SurveyGO是什么
SurveyGO(卷姬) 是清华联合面壁智能团队开源的AI论文写作工具。支持根据用户输入的论文主题和描述,快速生成结构清晰、内容丰富的综述文章,帮助科研人员...
ChineseLiPS–智源研究院联合南大开源的中文多模态语音识别数据集
AI工具百科:
ChineseLiPS是什么
ChineseLiPS 是智源研究院联合南开大学共同打造的高质量中文多模态语音识别数据集,包含100小时的语音、视频和手动转录文本,创新性地融合了唇读视频和...
WriteHERE–开源的AI长文写作框架,单次生成超长文本
工具百科:WriteHERE是什么WriteHERE是Jürgen Schmidhuber领衔的团队开源的AI长文写作框架。WriteHERE基于异质递归规划(Heterogeneous Recursive Planning)技术,动态分解写作任务为检索...
StableAudioOpenSmall–StabilityAI和Arm推出的文本到音频生成模型
AI工具百科:
Stable Audio Open Small是什么
Stable Audio Open Small 是 Stability AI 与 Arm 合作推出的轻量级文本到音频生成模型。基于 Stable Audio Open 模型,参数量从11亿减少...
Llama4–Meta开源的多模态系列AI模型,重夺开源王座
AI工具百科:
Llama 4是什么
Llama 4 是 Meta 开源的多模态系列AI模型。首次采用混合专家(MoE)架构,在训练和推理时计算效率更高。Llama 4 目前有 Scout 和 Maverick 两个版本。
...
LanDiff–浙大联合月之暗面推出的文本到视频生成混合框架
AI工具百科:
LanDiff是什么
LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,...
amis–百度开源的低代码前端框架
Ai工具百科:
amis是什么
amis 是百度开源的低代码前端框架,基于简单的 JSON 配置快速生成各种后台页面,无需编写复杂前端代码。amis支持表单、表格、图表、CRUD 操作等功能,提供丰...
AudioSDS–NVIDIA推出的扩展文本条件音频扩散模型
AI工具百科:
AudioSDS是什么
AudioSDS是NVIDIA AI研究团队推出的创新技术,将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型,为音频处理领域带来了重大突破。无...
Dolphin–清华联合海天瑞声推出的语音识别大模型
AI工具百科:
Dolphin是什么
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言...
ICEdit–浙江大学联合哈佛大学推出的指令式图像编辑框架
AI工具百科:
ICEdit是什么
ICEdit(InContext Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文感知能力...
DeepResearchWebUI–开源AI研究助手,逐步深入挖掘研究主题
AI工具百科:
Deep Research Web UI是什么
Deep Research Web UI 是开源的 AI 研究助手工具,帮助用户高效地进行深度研究。通过 AI 驱动的迭代搜索,逐步深入挖掘指定主题,以树状结构...
KiminaProver–月之暗面联合Numina推出的数学定理证明模型
AI工具百科:
KiminaProver是什么
KiminaProver是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean 4语言中严...

