Intraclass Correlation Coefficient, ICC是什么

在医学研究和影像处理中,ICC(组内相关系数) 是评价“不同的人(或同一个人在不同时间)做同一件事结果准不准、稳不稳定”最核心的指标。

简单来说,在你这个场景里,它衡量的是:两名医生对同一份影像勾画出的肌肉轮廓,重合度和一致性高不高。


1. 为什么要用 ICC 而不是普通的相关系数?

你可能听过 Pearson 相关系数($r$),但它只能看“走势”是否一致。

  • 例子:如果医生 A 给出的肌肉面积总是 100,而医生 B 总是给 200。虽然 B 始终是 A 的两倍(走势完美一致),但他们的测量值差了一倍
  • ICC 的优势:它不仅看相关性,还看绝对数值的一致性。如果两个人的勾画结果数值差距很大,ICC 就会很低。

2. ICC 的数值代表什么?

ICC 的取值范围在 0 \sim 1 之间,数值越高,说明两名医生勾画的差异越小:

ICC 取值 一致性程度
> 0.75 极好 (Excellent) —— 这是医学论文发表的理想水平
0.60 ~ 0.74 良好 (Good)
0.40 ~ 0.59 一般 (Fair)
< 0.40 较差 (Poor)

提示:如果你的 ICC 达到了 0.8 以上,就说明这两个医生对这四类肌肉(PM, QL, ES, MF)的边界定义非常统一,数据是可靠的。

总结

ICC 就是给你的标注质量“打分”

  • 如果 ICC 高:说明两名医生勾画得差不多,训练出来的 AI 模型学到的特征是稳定的。
  • 如果 ICC 低:说明这四块肌肉(尤其是边界模糊的 QL 或 MF)的勾画标准不统一,需要医生重新对齐标准,否则 AI 也会被教坏。