4cfad5ae0f
- 全新ui - 全面优化websocket逻辑,提高数字人和ui连接的稳定性及资源开销 - 全面优化唤醒逻辑,提供稳定的普通唤醒模式和前置词唤醒模式 - 优化拾音质量,支持多声道麦克风拾音 - 优化自动播放服务器的对接机制,提供稳定和兼容旧版ue工程的对接模式 - 数字人接口输出机器人表情,以适应新fay ui及单片机的数字人表情输出 - 使用更高级的音频时长计算方式,可以更精准控制音频播放完成后的逻辑 - 修复点击关闭按钮会导致程序退出的bug - 修复没有麦克风的设备开启麦克风会出错的问题 - 为服务器主机地址提供配置项,以方便服务器部署
33 lines
869 B
Markdown
33 lines
869 B
Markdown
## 语音服务介绍
|
||
|
||
该服务以modelscope funasr语音识别为基础
|
||
|
||
|
||
## Install
|
||
pip install torch
|
||
pip install modelscope
|
||
pip install testresources
|
||
pip install websockets
|
||
pip install torchaudio
|
||
pip install FunASR
|
||
|
||
## Start server
|
||
|
||
2、python -u ASR_server.py --host "0.0.0.0" --port 10197 --ngpu 0
|
||
|
||
## Fay connect
|
||
更改fay/system.conf配置项,并重新启动fay.
|
||
|
||
https://www.bilibili.com/video/BV1qs4y1g74e/?share_source=copy_web&vd_source=64cd9062f5046acba398177b62bea9ad
|
||
|
||
|
||
## Acknowledge
|
||
感谢
|
||
1. 中科大脑算法工程师张聪聪
|
||
2. [cgisky1980](https://github.com/cgisky1980/FunASR)
|
||
3. [modelscope](https://github.com/modelscope/modelscope)
|
||
4. [FunASR](https://github.com/alibaba-damo-academy/FunASR)
|
||
5. [Fay数字人助理](https://github.com/TheRamU/Fay).
|
||
|
||
--------------------------------------------------------------------------------------
|