多类别分类 VS 多标签分类

一、多类别分类（multi-class classification）

特点：一个样本，只属于多个类别中的“一个”

类别之间是互斥的
例子：
- 手写数字识别：0–9，一张图片只能是其中一个数字
- 情感分类：积极 / 中立 / 消极，一个评论通常只打一个情感标签
模型输出：
- 通常是一个长度为 C 的概率向量（C 是类别数），比如 [0.1, 0.2, 0.7] 表示第 3 类概率最高
- 常用激活函数：softmax（保证所有概率加起来=1）
常用损失函数：
- 交叉熵（Cross Entropy）
评价指标：
- 准确率（accuracy）、混淆矩阵等

一句话总结：“在这些类别里选一个” 的问题，用多类别分类。

特点：一个样本，可以同时属于多个类别

类别之间不互斥，可以同时为真
例子：
- 电影标签：一部电影可以同时是动作、科幻、爱情
- 图像标注：一张图里既有猫又有狗
- 文本主题：一篇文章可能同时属于体育和科技
模型输出：
- 通常是一个长度为 C 的向量，每个位置是“该标签为真”的概率，比如 [0.8, 0.1, 0.6] 表示：标签1和标签3很可能存在
- 常用激活函数：sigmoid（每个标签独立输出概率，互不影响）
常用损失函数：
- 二元交叉熵（Binary Cross Entropy），相当于对每个标签做一次二分类
评价指标：
- micro/macro F1、准确率@k、Hamming Loss、对每个标签分别算指标等

一句话总结：“这些标签里，可以选多个（甚至0个）” 的问题，用多标签分类。