小样本分类何时停止标注？饱和指数给出理论依据

机器学习中一个基本但缺乏理论指导的问题是：何时停止收集标注样本？一篇来自 arXiv 的新论文提出了 饱和指数 $S(K)$，用于衡量小样本分类中模型性能是否已趋于稳定，为标注决策提供了理论依据。

核心概念：饱和指数

饱和指数定义为 $S(K) = \operatorname{erank}(\widehat{\Sigma}_W^{(K)}) / K$，其中 $\operatorname{erank}$ 表示有效秩，$\widehat{\Sigma}_W^{(K)}$ 是 $K$ 个样本的池化类内协方差矩阵。论文证明，当 $S(K)$ 低于某个阈值时，协方差估计量已很好地逼近总体协方差，线性判别函数趋于稳定。该指数仅需支持特征即可在 $O(d^3)$ 时间内计算，无需测试标签或训练好的分类器。

实验验证

研究者在 17 个二元任务、6 个数据集 上进行了评估，共 246 次加倍对观测。结果显示：

16/17 个任务 中，$S(K)$ 与边际准确率增益呈正 Spearman 相关（中位数 $\rho = 0.811$）。
总体 Spearman 相关系数为 $\rho = 0.548$（$p = 1.1 \times 10^{-20}$）。

基于 $S(K)$ 值，论文定义了 三阶段相图：

探索阶段：边际增益平均 $3.48%$
过渡阶段：边际增益平均 $2.40%$
饱和阶段：边际增益平均 $0.82%$
所有两两显著性检验均支持该划分（$p \leq 0.008$）。

应用价值

作为二元停止规则，饱和指数的 AUC 达到 0.752，可为标注决策提供有意义的概率指导。此外，论文发现任务间渐近有效秩与峰值准确率无显著单调关系（Spearman $r_s = 0.380$, $p = 0.133$），而 低饱和指数搭配低准确率 可诊断表征能力不足。

局限与展望

当前结果仅适用于固定线性分类器的二元分类。作者讨论了向 N 路分类 和 预训练骨干表征 的扩展作为未来工作。这项工作为小样本学习中的样本效率问题提供了理论工具，有望降低标注成本。

二元小样本分类的谱相图：内在维度、几何饱和与表征诊断

核心概念：饱和指数

实验验证

应用价值

局限与展望

延伸阅读

相关资讯