人工智能聊天机器人显示出作为诊断伙伴的潜力

贝斯以色列女执事医疗中心(BIDMC)的内科研究人员将聊天机器人的概率推理与人类临床医生的概率推理进行了比较。发表在《美国医学会杂志网络开放》上的研究结果表明,人工智能可以作为医生有用的临床决策支持工具。

该研究的通讯作者亚当·罗德曼医学博士是一名内科医生和BIDMC医学部的研究员,他说:“人类很难进行概率推理,即基于计算几率做出决定的做法。”

“概率推理是做出诊断的几个组成部分之一,这是一个非常复杂的过程,需要使用各种不同的认知策略。我们选择孤立地评估概率推理,因为这是一个众所周知的人类可以使用支持的领域。”

罗德曼和他的同事们基于先前发表的一项全国调查,调查了550多名从业人员对5个医疗病例进行概率推理,罗德曼和他的同事们将公开可用的大型语言模型(LLM), Chat GPT-4,输入了相同的一系列病例,并运行了100次相同的提示,以产生一系列的反应。

聊天机器人——就像他们之前的医生一样——的任务是根据患者的陈述估计给定诊断的可能性。

然后,根据肺炎的胸部x光检查、乳腺癌的乳房x光检查、冠状动脉疾病的压力测试和尿路感染的尿液培养等测试结果,聊天机器人程序更新了它的估计。

当测试结果呈阳性时,这是一种平局;在两种情况下,聊天机器人的诊断比人类更准确,在两种情况下也同样准确,在一种情况下更不准确。

但当测试结果为阴性时,聊天机器人表现出色,在所有五种情况下都比人类更准确地做出诊断。

罗德曼说:“在检测结果为阴性后,人们有时会觉得风险比实际更高,这可能导致过度治疗、更多的检测和太多的药物。”

但罗德曼对聊天机器人和人类面对面的表现不太感兴趣,他更感兴趣的是,在诊所里有了这些新的辅助技术后,高技能的医生的表现可能会发生怎样的变化,罗德曼补充说。

他和同事们正在对此进行调查。

法学硕士无法接触外部世界——他们不像流行病学家,甚至不像扑克玩家那样计算概率。他们所做的与人类如何做出现场概率决策有很多共同之处,”他说。

“但这就是令人兴奋的地方。即使不完美,它们的易用性和整合到临床工作流程中的能力理论上可以使人类做出更好的决定,”他说。

“未来迫切需要对人类集体智能和人工智能进行研究。”

合著者包括马萨诸塞大学阿默斯特分校的托马斯·a·巴克利;Arun K. Manrai,哈佛医学院博士;Daniel J. Morgan, MD, MS,马里兰大学医学院。

罗德曼报告说,他接受了戈登和贝蒂·摩尔基金会的资助。摩根报告说,他得到了退伍军人事务部、卫生保健研究和质量局、疾病控制和预防中心以及国家卫生研究院的资助,并得到了美国传染病学会、美国卫生保健流行病学学会的旅费报销。美国内科医师学会和世界心脏卫生组织外提交了这份工作。


作者:贝斯以色列女执事医疗中心

链接:https://www.sciencedaily.com/releases/2023/12/231211114509.htm

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com