研究人员测试AI-powered chatbot的医疗诊断能力
在近期发表的一项实验《美国医学会杂志》physician-researchers在贝斯以色列女执事医疗中心(BIDMC)测试一个众所周知的公开聊天机器人的能力在具有挑战性的医疗情况下作出准确的诊断。团队发现,生成AI, Chat-GPT 4,选择正确的诊断作为其最高近40%的诊断提供正确的诊断时间和潜在的列表在三分之二的具有挑战性的情况下诊断。
生成的人工智能是指一种人工智能,使用模式和信息已经创建新的训练内容,而不是简单地处理和分析现有数据。生成人工智能的一些最著名的例子是所谓的聊天机器人,用人工智能的一个分支称为自然语言处理(NLP),让计算机理解,解释并生成类似人类的语言。
生成人工智能聊天机器人是准备革新创意产业的强大工具,教育、客户服务等等。然而,很少有人知道他们的潜在的性能临床,如复杂的诊断推理。
“最近人工智能的进步导致生成人工智能模型,能够详细的文本响应,取得高分在标准化的医学考试,”亚当·罗德曼说,医学博士,副主任英里每小时在媒体和教育创新交付(im)倡议BIDMC和哈佛医学院的老师。
“我们想知道这样一个生成模型“认为”像一个医生,所以我们问一个解决标准化复杂的诊断情况下用于教育目的。它确实非常好。”
评估chatbot的诊断技能,罗德曼和他的同事使用临床病理的情况下会议(年度"特别关注国"),一系列的复杂和富有挑战性的病人例,包括相关的临床和实验室数据,成像研究,组织病理学结果发表在新英格兰医学杂志》上用于教育目的。
评估70年共产党情况下,人工智能完全匹配的最后共产党诊断27(39%)的情况下。在64%的情况下,最终共产党诊断包括艾未未的differential-a列表中可能的条件,可以解释病人的症状,病史、临床表现和实验室或成像结果。
“虽然聊天机器人不能取代一个训练有素的医务人员的专业技能和知识,生成人工智能是一个有前途的潜在兼职人类认知诊断,”第一作者说查希尔Kanjee,医学博士,英里,在BIDMC hospitalist和哈佛医学院助理教授。
“它有可能帮助医生理解复杂的医疗数据和扩大或改进我们的诊断思维。最佳使用,我们需要更多研究的好处和限制这种技术,很多隐私问题需要解决,但这些都是未来的诊断和激动人心的发现病人护理。"
“我们的研究增加了越来越多的文献表明承诺能力的人工智能技术,”合著者拜伦·克洛说,医学博士,一位内科医生在BIDMC和哈佛医学院的老师。
“进一步调查将帮助我们更好地理解这些新人工智能模型如何变换卫生保健服务。"
更多信息:查希尔Kanjee et al,生成人工智能模型的精度在一个复杂的诊断的挑战,《美国医学会杂志》(2023)。DOI: 10.1001 / jama.2023.8288