OrpheusTTS–开源AI语音合成系统,支持多种语音风格
AI工具百科:
Orpheus TTS是什么
Orpheus TTS 是基于 Llama3b 架构的开源文...
RelightVid–上海AILab联合复旦等高校推出的视频重照明模型
AI工具百科:
RelightVid是什么
RelightVid是上海 AI Lab、复旦大学、上海交...
MegaTTS3–字节与浙江大学合作推出的零样本语音合成系统
AI工具百科:
MegaTTS 3是什么
MegaTTS 3是字节跳动与浙江大学合作推出的零...
WorldPM–阿里Qwen团队联合复旦推出的偏好建模模型系列
AI工具百科:
WorldPM是什么
WorldPM(World Preference Modeling)是阿里巴...
StepVideoTI2V–阶跃星辰开源的图生视频模型
AI工具百科:
StepVideoTI2V是什么
StepVideoTI2V 是阶跃星辰(StepFun)推...
CosmosReason1–NVIDIA推出的系列多模态大语言模型
AI工具百科:
CosmosReason1是什么
CosmosReason1 是NVIDIA推出的系列多模态...
GaussianCity–南洋理工大学SLab团队推出的3D城市生成框架
AI工具百科:
GaussianCity是什么
GaussianCity 是南洋理工大学 SLab 团队推...
Qwen2.5Omni–阿里开源的端到端多模态模型
AI工具百科:
Qwen2.5Omni是什么
Qwen2.5Omni 是阿里开源的 Qwen 系列旗舰级...
SeniorTalk–智源联合南开开源的超高龄老年人中文对话语音数据集
AI工具百科:
SeniorTalk是什么
SeniorTalk 是智源研究院联合南开大学计算机...
OpenMathNemotron–英伟达开源的数学推理系列模型
AI工具百科:
OpenMathNemotron是什么
OpenMathNemotron是英伟达推出的系列...
Vid2World–清华联合重庆大学推出视频模型转为世界模型的框架
AI工具百科:
Vid2World是什么
Vid2World是清华大学联合重庆大学推出的创新...
WebSSL–Meta联合纽约大学等机构推出的视觉自监督学习系列模型
AI工具百科:
WebSSL是什么
WebSSL(Webscale SelfSupervised Learning)是M...

