小橄榄
Go to file
xszyou 750e77e8b1 集成灵聚NLP api及UI修正
1、集成灵聚NLP api(支持GPT3.5及多应用);
 2、ui修正。
2023-06-21 17:54:26 +08:00
ai_module 集成灵聚NLP api及UI修正 2023-06-21 17:54:26 +08:00
android_connector_demo 2023.02.10 2023-02-10 19:50:47 +08:00
bin 提供funasr集成 2023-05-17 18:38:47 +08:00
core 集成灵聚NLP api及UI修正 2023-06-21 17:54:26 +08:00
gui 集成灵聚NLP api及UI修正 2023-06-21 17:54:26 +08:00
images 集成灵聚NLP api及UI修正 2023-06-21 17:54:26 +08:00
python_connector_demo 修复多个bug 2023-05-23 00:49:31 +08:00
scheduler Update 2022-06-20 11:05:10 +08:00
shell 2022.10.27 2022-10-27 14:58:48 +08:00
test 集成本地唇型算法 2023-06-17 00:14:12 +08:00
utils 集成灵聚NLP api及UI修正 2023-06-21 17:54:26 +08:00
.gitignore Update 2022-06-20 11:05:10 +08:00
[Start] PowerShell.bat 2023.01 2023-01-31 12:40:36 +08:00
[Start].bat 2023.01 2023-01-31 12:40:36 +08:00
config.json 助理版多处优化 2023-06-14 20:34:36 +08:00
favicon.ico 助理版多处优化 2023-06-14 20:34:36 +08:00
fay_booter.py 助理版多处优化 2023-06-14 20:34:36 +08:00
icon.png Update 2022-06-20 11:05:10 +08:00
LICENSE Update 2022-06-20 11:05:10 +08:00
main.py 助理版多处优化 2023-06-14 20:34:36 +08:00
qa_demo.xlsx 2022.10.17 2022-10-17 11:32:51 +08:00
README.md 集成灵聚NLP api及UI修正 2023-06-21 17:54:26 +08:00
requirements.txt 多模态的支持 2023-05-27 17:03:43 +08:00
system.conf 集成灵聚NLP api及UI修正 2023-06-21 17:54:26 +08:00
WebSocket.md 集成本地唇型算法 2023-06-17 00:14:12 +08:00
yolov8n-pose.pt 多模态的支持 2023-05-27 17:03:43 +08:00


Fay

FAY

Fay数字人助理

Fay数字人助理版是fay开源项目的重要分支专注于构建智能数字助理的开源解决方案。它提供了灵活的模块化设计使开发人员能够定制和组合各种功能模块包括情绪分析、NLP处理、语音合成和语音输出等。Fay数字人助理版为开发人员提供了强大的工具和资源用于构建智能、个性化和多功能的数字助理应用。通过该版本开发人员可以轻松创建适用于各种场景和领域的数字人助理为用户提供智能化的语音交互和个性化服务。

推荐玩法

灵聚NLP api(支持GPT3.5及多应用)b站"Fay数字人集成灵聚NLP api(支持GPT3.5及多应用)"

集成本地唇型算法:https://www.bilibili.com/video/BV1Zh4y1g7o7/?buvid=XXDD0B5DD6C43C070DF9E7E67930FC48B24DF&is_story_h5=false&mid=Pvwl%2Ft1ahPM726k1L4%2FnRA%3D%3D&plat_id=202&share_from=ugc&share_medium=android&share_plat=android&share_source=WEIXIN&share_tag=s_i&timestamp=1686926382&unique_k=Jdqazy3&up_id=2111554564

给数字人加上眼睛集成yolo+VisualGLM)B站视频

给Fay加上本地免费语音识别达摩院funaar: https://www.bilibili.com/video/BV1qs4y1g74e/?share_source=copy_web&vd_source=64cd9062f5046acba398177b62bea9ad

消费级pc大模型ChatGLM-6B的基础上前置Rasa会话管理https://m.bilibili.com/video/BV1D14y1f7pr

UE5工程https://github.com/xszyou/fay-ue5

真人视频三维重建NeRFhttps://github.com/waityousea/xuniren

Fay数字人助理版

注:带货版移到分支fay-sales-edition

助理版Fay控制器使用语音沟通语音和文字回复文字沟通文字回复。

PC远程助理 PC demo

手机远程助理 android demo

与数字形象通讯(非必须,控制器需要关闭“面板播放”)

控制器与采用 WebSocket 方式与 UE 通讯

下载工程: https://pan.baidu.com/s/1RBo2Pie6A5yTrCf1cn_Tuw?pwd=ck99

下载windows运行包: https://pan.baidu.com/s/1CsJ647uV5rS2NjQH3QT0Iw?pwd=s9s8

工程:https://github.com/xszyou/fay-ue5

重要:

Fay服务端与数字人的通讯接口: ws://127.0.0.1:10002(已接通)

消息格式: 查看 WebSocket.md

与远程音频输入输出设备连接(非必须,外网需要配置http://ngrok.cc tcp通道的clientid

控制器与采用 socket(非websocket) 方式与 音频输出设备通讯

内网通讯地址: ws://127.0.0.1:10001

外网通讯地址: 通过http://ngrok.cc获取有伙伴愿意赞助服务器给社区免费使用吗

消息格式: 参考 remote_audio.py

二、Fay控制器核心逻辑

注:

以上每个模块可轻易替换成自家核心产品。

目录结构

.
├── main.py					# 程序主入口
├── fay_booter.py			# 核心启动模块
├── config.json				# 控制器配置文件
├── system.conf				# 系统配置文件
├── ai_module
│   ├── ali_nls.py			# 阿里云 实时语音
│   ├── ms_tts_sdk.py       # 微软 文本转语音
│   ├── nlp_lingju.py       # 灵聚 人机交互-自然语言处理
│   ├── xf_aiui.py          # 讯飞 人机交互-自然语言处理
│   ├── chatgpt.py          # gpt3.5对接
│   ├── yuan_1_0.py         # 浪潮.源大模型对接
│   ├── nlp_rasa.py         # ChatGLM-6B的基础上前置Rasa会话管理(强烈推荐)
│   ├── nlp_VisualGLM.py    # 对接多模态大语言模型VisualGLM-6B
│   ├── yolov8.py           # yolov8资态识别
│   └── xf_ltp.py           # 讯飞 情感分析
├── bin                     # 可执行文件目录
├── core                    # 数字人核心
│   ├── fay_core.py         # 数字人核心模块
│   ├── recorder.py         # 录音器
│   ├── tts_voice.py        # 语音生源枚举
│   ├── authorize_tb.py     # fay.db认证表管理
│   ├── content_db.py       # fay.db内容表管理
│   ├── interact.py         # 互动(消息)对象
│   ├── song_player.py      # 音乐播放(暂不可用)
│   └── wsa_server.py       # WebSocket 服务端
├── gui                     # 图形界面
│   ├── flask_server.py     # Flask 服务端
│   ├── static
│   ├── templates
│   └── window.py           # 窗口模块
├── scheduler
│   └── thread_manager.py   # 调度管理器
├── utils                   # 工具模块
    ├── config_util.py      
    ├── storer.py
    └── util.py
└── test                    # 都是惊喜

三、升级日志

2023.06.21

  • 集成灵聚NLP api(支持GPT3.5及多应用)
  • ui修正。

2023.06.17

  • 集成本地唇型算法。

2023.06.14

  • 解决多声道麦克风兼容问题;
  • 重构fay_core.py及fay_booter.py代码
  • ui适应布局调整
  • 恢复声音选择;
  • ”思考中...“显示逻辑修复。

2023.05.27

  • 修复多个bug消息框换行及空格问题、语音识别优化
  • 彩蛋转正Fay沟通与ChatGPT并行
  • 加入yolov8姿态识别
  • 加入VisualGLM-6B多模态单机离线大语言模型。

2023.05.12

  • 打出Fay数字人助理版作为主分支带货版移到分支fay-sales-edition
  • 添加Fay助理的文字沟通窗口文字与语音同步
  • 添加沟通记录本地保存功能;
  • 升级ChatGLM-6B的应用逻辑长文本与语音回复分离。

四、安装说明

环境

  • Python 3.9、3.10
  • Windows、macos、linux

安装依赖

pip install -r requirements.txt

配置应用密钥

  • 查看 AI 模块
  • 浏览链接,注册并创建应用,将应用密钥填入 ./system.conf

启动

启动Fay控制器

python main.py

AI 模块

启动前需填入应用密钥

代码模块 描述 链接
./ai_module/ali_nls.py 实时语音识别非必须免费3个月,asr二选一 https://ai.aliyun.com/nls/trans
./ai_module/funasr.py 达摩院开源免费本地asr 非必须asr二选一 fay/test/funasr/README.MD
./ai_module/ms_tts_sdk.py 微软 文本转情绪语音非必须不配置时使用免费的edge-tts https://azure.microsoft.com/zh-cn/services/cognitive-services/text-to-speech/
./ai_module/xf_ltp.py 讯飞 情感分析 https://www.xfyun.cn/service/emotion-analysis
./utils/ngrok_util.py ngrok.cc 外网穿透(可选) http://ngrok.cc
./ai_module/nlp_lingju.py 灵聚NLP api(支持GPT3.5及多应用)NLP多选1 https://open.lingju.ai 需联系客服务开通gpt3.5权限
./ai_module/yuan_1_0.py 浪潮源大模型NLP 多选1 https://air.inspur.com/
./ai_module/chatgpt.py ChatGPTNLP多选1 *******
./ai_module/nlp_rasa.py ChatGLM-6B的基础上前置Rasa会话管理NLP 多选1 https://m.bilibili.com/video/BV1D14y1f7pr
./ai_module/nlp_VisualGLM.py 对接VisualGLM-6B多模态单机离线大语言模型NLP 多选1 B站视频

五、使用说明

使用说明

  • 语音助理fay控制器麦克风输入源开启、面板播放开启
  • 远程语音助理fay控制器面板播放关闭+ 远程设备接入;
  • 数字人互动fay控制器麦克风输入源开启、面板播放关闭、填写性格Q&A+ 数字人;
  • 贾维斯、Her加入我们一起完成。

语音指令

关闭核心 静音 取消静音
关闭、再见、你走吧 静音、闭嘴、我想静静 取消静音、你在哪呢、你可以说话了
播放歌曲(音乐库暂不可用) 暂停播放 更多
播放歌曲、播放音乐、唱首歌、放首歌、听音乐、你会唱歌吗 暂停播放、别唱了、我不想听了 没有了...

人设

数字人属性,与用户交互中能做出相应的响应。

交互灵敏度

在交互中,数字人能感受用户的情感,并作出反应。最直的体现,就是语气的变化,如 开心/伤心/生气 等。 设置灵敏度,可改变用户情感对于数字人的影响程度。

接收来源

文本输入

通过沟通窗口与助理文本沟通

麦克风

选择麦克风设备,实现面对面交互,成为你的伙伴

socket远程音频输入

可以接入远程音频输入,远程音频输出

相关文章:

1、集成消费级pc大模型ChatGLM-6B的基础上前置Rasa会话管理https://m.bilibili.com/video/BV1D14y1f7pr

2、(34条消息) 非常全面的数字人解决方案_郭泽斌之心的博客-CSDN博客_数字人算法

3、【开源项目数字人FAY——Fay新架构使用讲解】 https://www.bilibili.com/video/BV1NM411B7Ab/?share_source=copy_web&vd_source=64cd9062f5046acba398177b62bea9ad

4、【开源项目FAY——UE工程讲解】https://www.bilibili.com/video/BV1C8411P7Ac?vd_source=64cd9062f5046acba398177b62bea9ad

5、m1机器安装办法Gason提供https://www.zhihu.com/question/437075754

6、bilbil主页xszyou的个人空间_哔哩哔哩_bilibili

商务联系QQ 467665317我们提供开发顾问、数字人模型定制及高校教学资源实施服务 http://yafrm.com/forum.php?mod=viewthread&tid=302

关注公众号(fay数字人)获取最新微信技术交流群二维码(请先star本仓库