评估模型拟合优度的核心指标及其科学应用指南
$$ R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2} $$
$y_i$: 实测值
$\hat{y}_i$: 预测值
$\bar{y}$: 均值
R² = 0.90 → 自变量能解释 90% 的因变量变异
R² < 0.50 → 模型可靠性不足
R² ≥ 0.990(如 EPA/ISO 标准)
R² ≥ 0.998(如重金属、医药)
速测流程要求: R² ≥ 0.996(葡萄糖标准曲线)
王星论文(草酸法): 实测 R² = 0.998(拟合方程 ΔA = 0.0021C + 0.015)
R² ≥ 0.85(证明方法间强相关)
高锰酸钾氧化比色法 vs. TOC 法: R² = 0.941
"高锰酸钾氧化比色法与 TOC 法显著相关(P > 0.05),可通过乘以校正系数 1.28 转换"
场景 | R² 要求 | 依据 |
---|---|---|
土壤属性预测 | ≥ 0.60 | 地统计学常用阈值 |
气候模型预测 | ≥ 0.75 | IPCC 报告推荐 |
医疗诊断模型 | ≥ 0.90 | FDA 审批最低标准 |
R² ≥ 0.20 即有意义
R² ≥ 0.80 才具可靠性
耕地复种指数研究: 空间自相关模型要求 R² > 0.70
要求: R² ≥ 0.998
结果: R² = 0.941
"高锰酸钾氧化比色法与 TOC 法显著相关(P < 0.01),可通过线性校正替代昂贵仪器。"
如 WSOC:R² 允许降低至 0.985(因信噪比增大)
R² ≥ 0.980 即可接受(优先时效性)
普遍要求 R² ≥ 0.990(环境科学领域)
检测场景
标准曲线?
R² ≥ 0.990
方法比对?
R² ≥ 0.85
预测模型?
社会科学 R² ≥ 0.20
环境科学 R² ≥ 0.60
在土壤检测中,标准曲线需严格满足 R² ≥ 0.995;方法比对时若 R² > 0.90(如王星的 0.941),即可认为方法可靠。
建议结合 P 值判断显著性,并考虑实际应用场景的精度要求。
北京蚕道科技有限公司