ChatGPT博士很快就会见到你。
周四公布的一项研究显示,该人工智能系统在美国医疗执照考试中取得了及格或接近及格的成绩。
发表在《公共科学图书馆数字健康》杂志上的这项研究的作者说:“在没有任何人工强化的情况下,通过这项众所周知的困难的专家考试,标志着临床人工智能成熟的一个显著里程碑。”
他们说:“这些结果表明,大型语言模型可能有助于医学教育,并可能有助于临床决策。”
ChatGPT能够在几秒钟内写出散文、诗歌和编程代码,它是由加利福尼亚州的初创公司OpenAI开发的。OpenAI成立于2015年,早期资金来自埃隆·马斯克等人。
微软在2019年向OpenAI投资了10亿美元,并刚刚与该公司签署了一项价值数十亿美元的新协议。
在这项研究中,加州AnsibleHealth的研究人员测试了ChatGPT在美国医学生和实习医生参加的三部分执照考试中的表现。
标准化考试测试了从基础科学到生物化学,从诊断推理到生命伦理学等多个医学学科的知识。
该研究称,在2022年6月的高考中,人工智能系统被测试了376个公开问题中的350个,而且聊天机器人事先没有接受任何专门的训练。
基于图像的问题被删除。
在三部分考试中,ChatGPT得分在52.4%到75%之间。
及格分数在60%左右。
根据这项研究,第一部分考试的重点是基础科学和药理学,通常由花了300-400小时专门学习时间的医学生参加。
第二部分一般由四年级医学生参加,强调临床推理、医疗管理和生命伦理学。
最后一部分是为完成至少六个月到一年的研究生医学教育的医生准备的。
这些问题以各种格式呈现给ChatGPT,包括开放式提示,如“根据所提供的信息,患者的诊断是什么?”
还有多项选择题,如:“患者的病情主要是由以下哪种病原体引起的?”
研究称,两名互不知情的医师评判员审查了这些回答,得出了最终的评分。
外部专家、新西兰惠灵顿维多利亚大学(Victoria University of Wellington)软件工程高级讲师西蒙·麦卡勒姆(Simon McCallum)指出,谷歌在一款名为Med-PaLM的人工智能医疗工具上取得了令人鼓舞的成果。
McCallum说:“ChatGPT可能会通过考试,但Med-PaLM能够像专业全科医生一样为患者提供建议。”“这两个系统都在改进。
“社会即将改变,我们可能很快就会从谷歌医生或必应护士那里得到医疗建议,而不是随意在网上搜索症状的疑病症警告。”
ChatGPT还以另一种方式证明对医学检查研究的作者有用。
合著者蒂芙尼·龚(Tiffany Kung)说,他们使用聊天机器人来帮助编写。