在医学研究和影像处理中,ICC(组内相关系数) 是评价“不同的人(或同一个人在不同时间)做同一件事结果准不准、稳不稳定”最核心的指标。
简单来说,在你这个场景里,它衡量的是:两名医生对同一份影像勾画出的肌肉轮廓,重合度和一致性高不高。
1. 为什么要用 ICC 而不是普通的相关系数?
你可能听过 Pearson 相关系数($r$),但它只能看“走势”是否一致。
- 例子:如果医生 A 给出的肌肉面积总是 100,而医生 B 总是给 200。虽然 B 始终是 A 的两倍(走势完美一致),但他们的测量值差了一倍!
- ICC 的优势:它不仅看相关性,还看绝对数值的一致性。如果两个人的勾画结果数值差距很大,ICC 就会很低。
2. ICC 的数值代表什么?
ICC 的取值范围在 0 \sim 1 之间,数值越高,说明两名医生勾画的差异越小:
| ICC 取值 | 一致性程度 |
|---|---|
| > 0.75 | 极好 (Excellent) —— 这是医学论文发表的理想水平 |
| 0.60 ~ 0.74 | 良好 (Good) |
| 0.40 ~ 0.59 | 一般 (Fair) |
| < 0.40 | 较差 (Poor) |
提示:如果你的 ICC 达到了 0.8 以上,就说明这两个医生对这四类肌肉(PM, QL, ES, MF)的边界定义非常统一,数据是可靠的。
总结
ICC 就是给你的标注质量“打分”。
- 如果 ICC 高:说明两名医生勾画得差不多,训练出来的 AI 模型学到的特征是稳定的。
- 如果 ICC 低:说明这四块肌肉(尤其是边界模糊的 QL 或 MF)的勾画标准不统一,需要医生重新对齐标准,否则 AI 也会被教坏。