项目简介
该项目实现了一个实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至3秒,适合各种应用场景。
截图
特色
- 端到端语音解决方案:支持GLM-4-Voice及级联方案(ASR-LLM-TTS)。
- 可自定义形象与音色:用户可根据需求自由设置数字人的外观和声音。
- 音色克隆支持:通过上传参考音频生成个性化语音。
- 低延迟响应:首包延迟仅为3秒,提升用户体验。
- 无需训练:简化使用流程,适合快速部署和开发。
- 多种技术选型:集成ASR、LLM、TTS等模块,灵活应对不同需求。
项目地址
本资源网每日更新精品源码,宁缺毋滥,只做能用的精品源码。源码大部分为购买淘宝互站上的源码,少部分来自其他论坛的代理源码。均为精品!!目前源码数量还少,VIP价格较低,早上车早赚到!!!源码搭建教程详情请查看:https://yigexueshe.com
黑马源码资源网 » 实时语音交互数字人项目:支持端到端语音方案与音色克隆功能,实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS
黑马源码资源网 » 实时语音交互数字人项目:支持端到端语音方案与音色克隆功能,实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS