Commit Graph

10 Commits

Author SHA1 Message Date
xszyou
ae1d2ae292 多模态的支持
+ 修复多个bug:消息框换行及空格问题、语音识别优化;
+ 彩蛋转正,Fay沟通与ChatGPT并行;
+ 加入yolov8姿态识别;
+ 加入VisualGLM-6B多模态单机离线大语言模型。
2023-05-27 17:03:43 +08:00
xszyou
023df4deb1 上传彩蛋
1、上传chatgpt彩蛋;
2、修复音频合成过长不播放问题。
2023-05-19 18:12:02 +08:00
xszyou
524e4d0e65 提供funasr集成
1、修正语音和文字的交互逻辑;
2、提供funasr的可选集成。
2023-05-17 18:38:47 +08:00
xszyou
57b362fa6b 提高抖音字幕监听的稳定性及包兼容性
1、清除旧逻辑代码;
2、优化监听逻辑;
3、调整包版本的兼容性python3.8、3.9、3.10。
2023-04-24 12:46:17 +08:00
xszyou
2dca3ad6db 20230315
1、增加edge-tts语音合成(免费)可替换azure-tts(支持情绪化语音);
2、替换flask发行版运行方式。
2023-03-15 02:22:50 +08:00
xszyou
068f4d7d17 20230224
1、更新utils路径bug;
2、更正readme说明;
3、去除python自带包的安装。
2023-02-24 11:44:22 +08:00
xszyou
77b2c0a479 2023.02.10
1、加入了NLP三选一:xfaiui、yuan、chatgpt;
2、修复由pyaudio bug导致的录音错误;
3、修改远程音频输入输出设备同时只允许连1个;
2023-02-10 19:50:47 +08:00
xszyou
55fb0896b8 2023.01
Fay2.0:
1、控制器pc内网穿透,音频输入输出设备远程直连;
2、提供android 音频输入输出工程示例代码;
3、提供python音频输入输出工程示例代码(远程PC、树莓派等可用);
4、补传1.0语音指令音乐播放模块(暂不支持远程播放);
5、重构及补充若干工具模块:websocket、多线程、缓冲器、音频流录制器等;
6、修复1.x版本的多个bug。
2023-01-31 12:40:36 +08:00
xszyou
b1c78fd260 2022.10.17
1、更新语音指令;
2、修正微软key的配置项;
3、提供q&a模版;
2022-10-17 11:32:51 +08:00
Ram
338917fdf7 Update 2022-06-20 11:05:10 +08:00