diff --git a/datasets/README.md b/datasets/README.md new file mode 100644 index 0000000..6071518 --- /dev/null +++ b/datasets/README.md @@ -0,0 +1,28 @@ +# EmoLLM数据集 + +* 数据集按用处分为两种类型:**General** 和 **Role-play** +* 数据按格式分为两种类型:**QA** 和 **Conversation** +* 数据汇总:General(**6个数据集**);Role-play(**3个数据集**) + + ## 数据集类型 +* **General**:通用数据集,包含心理学知识、心理咨询技术等通用内容 +* **Role-play**:角色扮演数据集,包含特定角色对话风格数据等内容 + +## 数据类型 +* **QA**:问答对 +* **Conversation**:多轮对话 + +## 数据集汇总 + +| Category | Dataset | Type | Total | +| :---------: | :-------------------: | :----------: | :-----: | +| *General* | data | Conversation | 5600+ | +| *General* | data_pro | Conversation | 36500+ | +| *General* | multi_turn_dataset_1 | Conversation | 36,000+ | +| *General* | multi_turn_dataset_2 | Conversation | 27,000+ | +| *General* | single_turn_dataset_1 | QA | 14000+ | +| *General* | single_turn_dataset_2 | QA | 18300+ | +| *Role-play* | aiwei | Conversation | 4000+ | +| *Role-play* | SoulStar | QA | 11200+ | +| *Role-play* | tiangou | Conversation | 3900+ | +| …… | …… | …… | …… |