OliveSensorAPI/evaluate/README.md

# EmoLLM评测

## 通用指标评测

* 具体指标、方法见 see [General_evaluation.md](./General_evaluation.md)

| Model    | ROUGE-1 | ROUGE-2 | ROUGE-L | BLEU-1  | BLEU-2  | BLEU-3  | BLEU-4  |
|----------|---------|---------|---------|---------|---------|---------|---------|
| Qwen1_5-0_5B-Chat | 27.23%  | 8.55%   | 17.05%  | 26.65%  | 13.11%  | 7.19%   | 4.05%   |
| InternLM2_7B_chat  | 37.86%  | 15.23%   | 24.34%  | 39.71%  | 22.66%  | 14.26%   | 9.21%   |

## 专业指标评测

* 具体指标、方法见 [Professional_evaluation.md](./Professional_evaluation.md)

|       Metric      |    Value   |
|-------------------|------------|
| Comprehensiveness | 1.32       |
| Professionalism   | 2.20       |
| Authenticity      | 2.10       |
| Safety            | 1.00       |