BILIVE–开源AI录播工具,一站式自动直播录制与处理
AI工具百科:
BILIVE是什么
BILIVE 是基于 AI 技术的开源工具,专为 B 站直播录制与处理设计。工具支持自动录制直播、渲染弹幕和字幕,支持语音识别、自动切片精彩片段,生成有趣的标...
Hautech.AI–AI模特生成工具,平面产品图自动生成模特展示图
AI工具百科:
Hautech.AI是什么
Hautech.AI 是基于AI技术生成逼真时尚模特照片的工具。Hautech.AI 支持将简单的平面产品图像快速转换为高质量的模特展示图,具有高度的定制化功能,用...
混元游戏–腾讯混元推出的首个工业级AIGC游戏内容生产引擎
AI工具百科:
混元游戏是什么
混元游戏(腾讯混元游戏视觉生成平台)是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎。通过AI技术为游戏美术设计提供高效解决方案,具备AI美 术...
TesserAct–AI4D具身世界模型,能预测3D场景的动态演变
AI工具百科:
TesserAct是什么
TesserAct 是创新的 4D 具身世界模型,能预测 3D 场景随时间的动态演变,响应具身代理的动作。通过训练 RGBDN(RGB、深度和法线)视频数据来学习,超越...
DeckSpeed–AIPPT制作工具,支持实时反馈调整内容
AI工具百科:
DeckSpeed是什么
DeckSpeed是AI演示文稿制作工具。基于对话式交互,根据用户的指令和想法,快速生成专业、个性化的幻灯片,无需依赖传统模板。用户能实时反馈,调整颜色...
ProxyLite–开源视觉语言模型,支持自动化网页任务
AI工具百科:
Proxy Lite是什么
Proxy Lite 是开源的轻量级视觉语言模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite 能像人类一样操作浏览器,完成网页交互、数据抓取、表单...
KimiAudio–MoonshotAI开源的音频基础模型
AI工具百科:
KimiAudio是什么
KimiAudio 是 Moonshot AI 推出的开源音频基础模型,专注于音频理解、生成和对话任务。在超过 1300 万小时的多样化音频数据上进行预训练,具备强大的音...
VersatileOCRProgram–开源多模态OCR工具,精准提取复杂结构化数据
AI工具百科:
VersatileOCRProgram是什么
VersatileOCRProgram是开源多模态OCR工具,支持从复杂的教育材料中提取结构化数据,生成适合机器学习训练的高质量数据集。VersatileOCRProgra...
AIMeetingNotes–Notion推出的AI会议笔记工具
AI工具百科:
AI Meeting Notes是什么
AI Meeting Notes 是Notion推出的AI会议记录工具,能实时转录会议内容,在会议结束后自动生成包含关键摘要、用户笔记对比和行动项的完整纪要。
...
ChatTS14B–字节开源的时间序列理解和推理大模型
AI工具百科:
ChatTS14B是什么
ChatTS14B 是字节跳动研究团队开源的专注于时间序列理解和推理的大型语言模型,参数量达 140 亿。基于 Qwen2.514BInstruct 微调而成,通过合成数据对齐...

