导览
近期,我对癌症筛查的探讨持续深入,特别是在过去几个月内,一系列关于人工智能如何彻底革新癌症检测的报道引起了广泛关注。上周,微软宣布与数字病理学公司Paige合作,共同构建全球规模最大的基于图像的人工智能癌症识别模型。这款算法的训练数据集囊括了惊人的400万张影像资料。
Paige的首席执行官安迪·莫耶(Andy Moye)在媒体访谈中指出:“这是癌症治疗领域的一个历史性时刻。”这一合作旨在利用人工智能的力量,推动癌症识别的精确性和效率。
2023年8月,首个基于人工智能的乳腺癌筛查临床试验结果公布。研究者对比了两种阅片方法:一种由两位独立的放射科医师完成,另一种则引入了人工智能,采用1至10的数字风险评分系统为患者打分。在采用人工智能支持的模型中,评分达10分的患者其癌症风险最高,这类病例还需由两位放射科医师进一步审查。这一模型不仅显著降低了44%的工作量,还增加了20%的癌症检出率。
然而,数据并未总是支持癌症筛查能显著延长寿命的理论。8月中旬发表的研究综述,通过分析随机临床试验文献,对比接受癌症筛查与未接受筛查人群的死亡率(包括所有原因死亡),发现在大多数常见癌症类型中,两者之间并无显著差异。唯一例外是乙状结肠镜检查,这是一种专门用于检测结肠下部癌症的筛查手段。
这一现象背后的原因尚不完全明确。可能涉及研究设计的局限性,如跟踪时间不够长,无法揭示差异;也可能是因为某些癌症筛查带来的好处更为有限,尤其是在早期发现致命癌症的情况下。然而,若筛查发现的是不会导致死亡的癌症,其实际效果可能并不显著。
过度诊断问题引起了广泛讨论。它并非指误诊或假阳性诊断,而是指正确的诊断对患者健康几乎无益,甚至可能带来负面影响。在多数癌症病例中,缺乏有效手段区分非致命与致命肿瘤,导致医生倾向于采取较为激进的治疗策略。
亚当森博士提出,癌症检测算法通过识别标记为“癌症”或“非癌症”的图像,学习识别模式。然而,对于癌症构成的复杂性,没有绝对答案。尽管机器学习算法的诊断结果在一致性与可复制性上优于人类判断,但在判断哪些肿瘤必然导致症状或死亡方面,算法的准确性未必优于人类。
人工智能在癌症筛查中的应用仍处于探索阶段,其对过度诊断的潜在影响尚待评估。亚当森博士建议在算法训练数据中加入第三类分类:“可能是癌症”,以区分专家意见存在分歧的病例。对于这类患者,可能需要采取更为保守的治疗方法。
当前,对于人工智能在癌症诊断领域的具体效能评价还需谨慎,公众对相关报道应持有批判性态度。重要的是,我们需更加关注筛查的实际效果与潜在风险,以及如何在提高诊断准确性的同时,避免不必要的过度诊断,保护患者利益。