JMIR Nursing:AI 能当公共卫生护士吗?三款顶级大模型挑战日本国家考试
2026-04-30 熊佳仪 MedSci原创
大型语言模型虽已掌握相当程度的公共卫生护理专业知识,展现出作为教育辅助工具的巨大潜力,但其在模拟现实工作场景中复杂多因素决策方面的局限性不容忽视。
深度解析医学证据,DeepEvidence为你支撑决策 近年来,以GPT-4o、Claude Opus 4和Gemini 2.5 Pro为代表的大型语言模型在医学与护理学国家考试中展现出令人瞩目的性能,然而,其在强调社区健康、多学科协作与社会决定因素整合的公共卫生护理领域的能力尚未得到验证。本研究填补了这一空白,首次系统评估了上述三款主流大型语言模型应对日本第111届公共卫生护士国家考试的表现。公共卫生护理不仅要求扎实的生物医学知识,更需综合考量区域特征、居民需求、社会资源及政策法规等多重因素,其复杂决策过程对当前人工智能的推理能力构成了独特的挑战。 为全面比较模型表现,研究者采用了普查方法,将此次考试的全部110道试题纳入分析。所有问题均于2025年6月在一个全新的独立聊天窗口中,使用标准化的日语提示词向各模型进行提问,以避免上下文干扰。对应考题中一般的单句型题目、情境型题目、含图表题目以及计算题,研究团队分别设计了六种标准化的提示词模板,确保评估过程的一致性与可重复性。题目根据内容被划分为一般性问题和情境性问题,根据形式分为纯文本题和图表或计算题,并根据选项类型分为单选题和多选题。
作者:熊佳仪
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言






#大型语言模型# #公共卫生护理#
36