Merge pull request #4 from SmartFlowAI/main

emollm main 2 chg0901 main
This commit is contained in:
HongCheng 2024-07-17 11:32:42 +09:00 committed by GitHub
commit 6817795b20
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194
2 changed files with 2 additions and 2 deletions

View File

@ -45,7 +45,7 @@ class EmoLLMRAG(object):
def get_retrieval_content(self, query) -> str: def get_retrieval_content(self, query) -> str:
""" """
Input: 用户提问, 是否需要rerank Input: 用户提问, 是否需要rerank
ouput: 检索后并且 rerank 的内容 output: 检索后并且 rerank 的内容
""" """
content = [] content = []

View File

@ -138,7 +138,7 @@ model = dict(
### 数据处理 ### 数据处理
- 使用 `../datasets/process.py` 以处理 **multi_turn_dataset(1 和 2QA数据转单轮对话)** `data.json``data_pro.json` 文件(两个多轮对话),以添加或者调整 **`system` prompt** - 使用 `../datasets/process.py` 以处理 **multi_turn_dataset(1 和 2QA数据转单轮对话)** `data.json``data_pro.json` 文件(两个多轮对话),以添加或者调整 **`system` prompt**
- 使用 `../datasets/processed/process_single_turn_conversation_construction.py` 处理 **single-turn dataset** (1 和 2),修改 (`input` 和 `ouput`) ,并在每次 **conversation** 中添加 **`system` prompt** - 使用 `../datasets/processed/process_single_turn_conversation_construction.py` 处理 **single-turn dataset** (1 和 2),修改 (`input` 和 `output`) ,并在每次 **conversation** 中添加 **`system` prompt**
- 使用 `../datasets/processed/process_merge.py` 用于合并 `../datasets/processed/` 目录下**6个更新后的数据集**,生成一个合并后的数据集 `combined_data.json`用于最终训练 - 使用 `../datasets/processed/process_merge.py` 用于合并 `../datasets/processed/` 目录下**6个更新后的数据集**,生成一个合并后的数据集 `combined_data.json`用于最终训练
## 基于XTuner的微调🎉🎉🎉🎉🎉 ## 基于XTuner的微调🎉🎉🎉🎉🎉