OliveSensorAPI/datasets/README.md

# EmoLLM数据集

* 数据集按用处分为两种类型：**General** 和 **Role-play**
* 数据按格式分为两种类型：**QA** 和 **Conversation**
* 数据汇总：General（**6个数据集**）；Role-play（**3个数据集**）

 ## 数据集类型
* **General**：通用数据集，包含心理学知识、心理咨询技术等通用内容
* **Role-play**：角色扮演数据集，包含特定角色对话风格数据等内容

## 数据类型
* **QA**：问答对
* **Conversation**：多轮对话

## 数据集汇总

|   Category  |        Dataset        |     Type     |  Total  |
| :---------: | :-------------------: | :----------: | :-----: |
|  *General*  |         data          | Conversation |  5600+  |
|  *General*  |       data_pro        | Conversation | 36500+  |
|  *General*  | multi_turn_dataset_1  | Conversation | 36,000+ |
|  *General*  | multi_turn_dataset_2  | Conversation | 27,000+ |
|  *General*  | single_turn_dataset_1 |      QA      | 14000+  |
|  *General*  | single_turn_dataset_2 |      QA      | 18300+  |
| *Role-play* |         aiwei         | Conversation |  4000+  |
| *Role-play* |       SoulStar        |      QA      | 11200+  |
| *Role-play* |        tiangou        | Conversation |  3900+  |
|     ……      |          ……           |      ……      |   ……    |

## 数据集来源
**General**：
* 数据集 data 来自本项目
* 数据集 data_pro 来自本项目
* 数据集 multi_turn_dataset_1 来源 [Smile](https://github.com/qiuhuachuan/smile)
* 数据集 multi_turn_dataset_2 来源 [CPsyCounD](https://github.com/CAS-SIAT-XinHai/CPsyCoun)
* 数据集 single_turn_dataset_1 来自本项目
* 数据集 single_turn_dataset_2 来自本项目

**Role-play**：
* 数据集 aiwei 来自本项目
* 数据集 tiangou 来自本项目
* 数据集 SoulStar 来源 [SoulStar](https://github.com/Nobody-ML/SoulStar)