AI大模型PK人类医生,谁更胜一筹
在近日举行的第二十二届中国脑血管病论坛上,一场别开生面的比赛——AI大模型PK人类医生引发关注。
此次比赛设置了3个各有特色的脑血管病诊疗病例,人类医生和3个AI大模型各自在有限时间内分析病例,并给出诊断结果和治疗方案。
参赛的AI大模型分别是39AI、豆包和DeepSeek(深度求索)。
首都医科大学宣武医院神经外科张璨医生介绍,39AI大模型是首个通过国家网信办备案的垂直医学大模型,接受过全球3000多万医学文献共识的训练。豆包大模型经过多种语料训练,在健康科普、咨询和疾病诊断分析等方面表现出色。DeepSeek是通用大语言模型,其R1模型的推理能力已被各行业广泛验证,本次比赛能检验其与针对医疗二次开发过后的模型存在哪些能力差异。
现场评委从诊断准确性、治疗方案准确性、知识面广度、逻辑清晰度、作答效率5个方面给参赛的人类医生及AI大模型评分。
首个临床病例很复杂。病例为巨大颅内动脉瘤患者,经既往术后未被完全治愈并出现头疼等症状,需设计全新治疗方案。
令在场观众和人类医生惊叹的是,AI大模型在短短几分钟内就给出诊断结果和治疗方案,并且实时展现在大屏上。
“AI大模型凭借对大量文献的学习,在诊断中关注到诸多细节,如高钠血症、下肢穿刺点血肿等,鉴别诊断也较为全面。”哈尔滨医科大学附属第一医院神经外科主任医师史怀璋点评时说。
不过,专家认为,AI虽能提供丰富信息,但缺乏医生的直觉和针对性。“面对复杂病例,AI给出多种选择,却未能像经验丰富的医生那样,精准判断出最适合患者的手术方案——高流量搭桥手术。”史怀璋说。
比赛结束后,人类选手和AI模型分别获得荣誉。
河北北方学院附属第一医院医生田齐获人类智慧守护者奖,河北省保定市第二中心医院医生王亚男获最佳临床表现奖,北京右安门医院医生张一鸣获最佳潜力新秀奖。豆包大模型获得精准诊断奖,39AI模型荣获最佳治疗方案奖,DeepSeek虽未经过针对医疗知识的强化训练,仍有不俗表现,获得最具创新潜力奖。
田齐接受科技日报记者采访时说,AI在速度和诊断全面性上具有明显优势,但在治疗针对性和共情能力方面,人类医生更胜一筹。
这一观点引发共鸣。王亚男也表示:“医生能与患者交流并给予情感支持,进而制定更加人性化、个性化的治疗方案。”
针对此次比赛,首都医科大学宣武医院神经外科主任张鸿祺说:“AI作答速度快、细节涉猎广,在常规疾病诊断上表现出色,准确性与人类相近且全面性更优。但在面对突发情况、个体化治疗和需要人文关怀的场景时,AI存在明显短板。”
“医疗安全始终是重中之重,速度并非关键因素。AI在医疗中应为辅助,人类医生凭借丰富的临床经验、个性化的治疗能力和人文关怀精神,仍将在医疗决策中起主导作用。”王亚男说。
这次比赛为医学人才培养提供了新思路。“在医疗行业人才培养方面,借助大模型开发诊疗、问答、考试助手,能帮助医学生查缺补漏,培养全面的临床思维。”张璨说,但如何让医学生在使用AI技术的同时,保留人类医生的独特优势,仍是教育者需要深入思考的问题。
张鸿祺强调,AI与人类医生并非竞争关系,而是相互补充、协同发展的伙伴。