OliveSensorAPI/datasets/README.md
2024-03-10 16:04:31 +08:00

1.8 KiB
Raw Blame History

EmoLLM数据集

  • 数据集按用处分为两种类型:GeneralRole-play
  • 数据按格式分为两种类型:QAConversation
  • 数据汇总General6个数据集Role-play3个数据集

数据集类型

  • General:通用数据集,包含心理学知识、心理咨询技术等通用内容
  • Role-play:角色扮演数据集,包含特定角色对话风格数据等内容

数据类型

  • QA:问答对
  • Conversation:多轮对话

数据集汇总

Category Dataset Type Total
General data Conversation 5600+
General data_pro Conversation 36500+
General multi_turn_dataset_1 Conversation 36,000+
General multi_turn_dataset_2 Conversation 27,000+
General single_turn_dataset_1 QA 14000+
General single_turn_dataset_2 QA 18300+
Role-play aiwei Conversation 4000+
Role-play SoulStar QA 11200+
Role-play tiangou Conversation 3900+
…… …… …… ……

数据集来源

General

  • 数据集 data 来自本项目
  • 数据集 data_pro 来自本项目
  • 数据集 multi_turn_dataset_1 来源 Smile
  • 数据集 multi_turn_dataset_2 来源 CPsyCounD
  • 数据集 single_turn_dataset_1 来自本项目
  • 数据集 single_turn_dataset_2 来自本项目

Role-play

  • 数据集 aiwei 来自本项目
  • 数据集 tiangou 来自本项目
  • 数据集 SoulStar 来源 SoulStar