57岁的李华亮最近觉得心脏不太舒服,所以他来到深圳罗湖医院。与以往不同的是,他不用在服务大厅举目无措,思考要挂什么科室;医院的AI(人工智能)结合他的过往病例和病情,建议他先去心内科诊断。熟知各类医学知识和病例的AI也已成为心内科医生最好的助手,为其提供更加周全的诊断方案,甚至还考虑到了李华亮之后准备种植牙的影响。
这个AI辅助医学的场景,与60年前美国学者在《新英格兰医学杂志》上畅想的的医疗信息化蓝图,产生了跨越时空的奇妙共振。
1970年:一本医学期刊里的AI预言
1970年,《新英格兰医学杂志》刊登了一篇题为《医学与计算机:变革的承诺与问题》的综述,没人想到它将预言半个世纪后的智能医疗革命。
这篇文章的作者,肾内科医生威廉·施瓦茨(William B. Schwartz)在AI技术尚未普及的年代宣称:“计算机将帮助医生记录病史、推荐诊断思路,并管理临床决策。”
在这篇尘封于1970年的文章里,施瓦茨不仅精准勾勒出现代电子病历系统的轮廓,更预见到智能诊断将成为医者思维的延伸。某种意义上,施瓦茨预见了现代AI医疗的雏形:从自动化电子病历到智能分诊系统,AI确实将医生从重复劳动中解放。
但医疗是对人本身的判断和交互,AI强大能力背后也会留下技术狂飙时被遮蔽的隐忧:当医生从传统的信息处理者转型为人机协同决策者时,医疗教育体系该如何重构?在数据成为新生产要素的时代,如何守护患者隐私的最后一公里?
有太多的潜力亟待发掘,也有太多风险需要被解决。而这份超前的思考,成为了AI医疗进化史的起点注解。
DENDRAL与MYCIN:AI第一次走进实验室
当施瓦茨发表预言和畅想时,在斯坦福大学的一个实验室里,最早的医疗AI实践已悄然开展。
20世纪60-70年代,人工智能研究从通用问题求解转向专业化领域,开创了“专家系统”的新纪元。这一变革的核心人物,“专家系统之父”爱德华·费根鲍姆(Edward Feigenbaum),先后开创了两个里程碑项目DENDRAL和MYCIN,为AI技术落地现实世界奠定了基石。
费根鲍姆正在调试DENDRAL系统
费根鲍姆的成长经历充满传奇色彩:幼年经历家庭变故的他,在继父的引导下很早就开始接触计算设备,随后“天才”般地16岁跳级进入卡内基梅隆大学。
一次跨学科的选修课让他结识了诺贝尔奖得主赫伯特·西蒙(Herbert Simon)——这位“决策理论之父”带领他踏入AI领域。此前,西蒙与艾伦·纽厄尔(Allen Newell)开发了首个通用问题求解程序GPS,这种符号学派的AI理念深深影响了费根鲍姆。
1965年,费根鲍姆与诺贝尔遗传学家约书亚·莱德伯格(Joshua Lederberg)合作启动DENDRAL项目。面对化学领域复杂分子结构解析的难题,他们创造性地将质谱数据与原子组合规则编码成算法。随着避孕药发明者化学家卡尔·杰拉西(Carl Djerassi)的加入,对分子结构的理解更上一层楼,DENDRAL系统性能显著提升,能够自主推导未知分子式。
虽然DENDRAL主要解决的是火星物质检测这样一个稍显冷门的场景,但它更重要的意义在于——标志着AI首次在专业领域达到人类专家水平,这一成就也进一步推动团队转向医疗应用。
DENDRAL系统负责人2006年合影(左一布坎南、左三费根鲍姆、左四莱德伯格)
在费根鲍姆的好友兼学生的布鲁斯·布坎南(Bruce Buchanan)和医学生爱德华·肖特利夫(Edward Shortliffe)的推动下,1972年,感染病诊疗系统MYCIN诞生。
它通过600余条“如果-那么”规则(如“若患者脑脊液革兰氏染色阳性→链球菌感染概率增加”),可分析患者血液感染和脑膜炎的情况,并提供抗生素治疗方案。在一项脑膜炎感染诊断的测试中,MYCIN获得准确率高达65%——甚至超过了初级医师水平。
MYCIN系统在1979年评估的结果,在实习医生与医学生中排名第一
尽管MYCIN从未进入临床(因缺乏数字化病历支持),但它开创了现代临床决策支持系统(CDSS)的基础范式:基于规则的推理,可解释的诊断逻辑,以及多因素综合判断。
INTERNIST-1:当人脑知识库遇上算法
AI与医学的结合,可谓是多点开花。同一时期,匹兹堡大学正进行着更狂野的尝试。
时任匹兹堡大学医学系主任的杰克·迈尔斯(Jack Duane Myers)在医学界享有盛誉。这位拥有超群记忆力的医师,青年时期每周投入20余小时研读医学文献,其卓越的临床推理能力被誉为内科界的"夏洛克·福尔摩斯"。
1973年,55岁的迈尔斯在卸任系主任之际萌生了新想法——开发医学辅助诊断系统,帮助医生完成内科诊断。这个想法很快就成为了现实——迈尔斯结识了师出艾伦·纽厄尔的计算机专家哈利·波普尔(Harry E. Pople)。
哈利·波普尔
但是,早期实验暴露了传统AI算法的局限:当系统需要统筹数千条临床参数时,可能性组合的指数级增长经常导致诊断的精准度不足,容易出现多种疾病推断或完全无法判定的困境。
事情的转机出现在医学生兰道夫·米勒的加入——这位坚定休学加入团队的医学生曾编写过计算机程序,凭借医学-计算机的双重视角,配合迈尔斯的海量医学知识输出,构建出首个原型系统DIALOG(诊断逻辑系统,后因名称版权问题被迫更名为INTERNIST-1),开启了医疗知识系统化整理的先河。
区别于同期斯坦福大学DENDRAL和MYCIN系统的技术路线,这个团队选择将重心转向知识储备建设。迈尔斯每日口述经严格筛选的医学知识(仅收录被独立验证两次以上的临床证据),建立标准化诊断数据库的决策,形成了独特的开发模式。
这种"重知识、轻算法"的战略虽限制了技术迭代,却意外推动了医学知识的系统整合。其数据库最终发展为持续更新至今的QMR(Quick Medical Reference,快捷医疗参考系统),并在20世纪90年代实现商业化应用。
1982年,INTERNIST系统正式发布,随后它的升级版本——CADUCEUS系统可识别千余种疾病,被誉为当时最先进的知识密集型专家系统。
专家系统的黄昏与隐伏的血脉
与此同时,在1978年,中国肝病中医关幼波联合计算科学家开发的“肝病辨证论治系统”,将中医诊疗逻辑首次编码为人工智能系统,在120例肝炎诊疗中取得与医生本人相当的疗效(总有效率80%)。这类早期系统共同构成AI医疗的专家系统的巅峰。
关幼波医生
但历史的车轮滚滚向前,不论是美国的MYCIN、INTERNIST系统,还是我国同期研发的中医诊疗程序,如今已逐步退出历史舞台。究其本质,这些系统作为人工智能发展的阶段性产物,其所依赖的符号主义范式已被现代基于机器学习,尤其是深度神经网络的技术架构所取代。
计算机辅助诊断系统(Computer-Aided Diagnosis,CAD)作为当时世界范围内少有的规模化应用成果,得益于专业化领域限制带来的技术深度拓展,在深度学习算法横空出世前,该类系统始终保持着医疗垂直领域智能应用的标杆地位。
这些早期系统的实践验证了人工智能的应用潜力,为学术界和产业界注入了持续发展的信心。以爱德华·费根鲍姆为代表的人工智能先驱,积极推动相关技术的产业化进程,形成了学术界与投资界的良性互动格局。
遗憾的是,上世纪70至90年代,人工智能研究普遍进入停滞状态——科学家期待的开放式智能交互系统未能实现,研发投入与预期产出严重失衡。随着苹果、微软引领的微型计算机革命兴起,专家系统因运营成本过高逐渐边缘化。
虽然这些系统的外在形态逐步退出应用场景,但其核心技术遗产已通过软件形态实现转移与演化。在当代各类专业应用程序与医学教育中,我们仍可追溯至MYCIN、INTERNIST等开创性系统的技术基因,只是相关技术载体已不再冠以人工智能之名。
回望50年前这批先驱者的探索时,我们既感叹其远见,也惊觉技术迭代的戏剧性:他们用编码规则演绎医学知识的努力,恰似普罗米修斯盗火,虽未直接点亮现代深度学习的火炬,却让人类在算法与生命健康的交叉路口,留下了永不褪色的路标。