ASJ:人工智能和大型语言模型的医学应用

2023-12-05 MedSci原创 MedSci原创

人工智能在医学领域应用的假设需要被验证。

人工智能(AI)的潜在医学应用正在科学文献中引起广泛关注,仅ChatGPT就发表了多达222篇论文,ChatGPT等大型语言模型以文本的形式解释、合成和输出信息。 OpenAI于2022年11月发布的ChatGPT席卷全球,彻底改变了医生与AI技术的交互方式。

Aesthetic Surgery Journal最新的一篇文章,作者回顾了描述ChatGPT准确性、可靠性和安全性的现有文献。

124种不同期刊报道了ChatGPT医学应用的文献。ChatGPT相关文献发文量最多的是Cureus (21.2%;n = 47), Annals of Biomedical Engineering (3.6%;n = 8)、Aesthetic Surgery Journal (2.7%;n = 6)。文献来源于34个国家,发文量最高的是美国(41.4%;n = 92),中国(9.5%;n = 21)、印度(6.3%;n = 14)。在撰写本文时,这些研究被引用了1354次,平均每篇文献被引用6.1次(范围,0 ~ 224)。ChatGPT文献平均月被引513.2次,平均每篇文献月被引2.4次。这些令人印象深刻的文献计量,在该技术发布短短6个月内就积累起来,并不一定与可靠性相关。

222篇文献中,62篇(27.9%)报告了ChatGPT的假设应用,主要是以给编辑的信形式发表。尽管这些文章引发了讨论,但大多数缺乏证据和科学严谨性。222篇文献中的121篇(54.5%)报告了已证实的应用,其中57篇(47.1%)既缺乏验证也缺乏ChatGPT性能评估,因此仅代表“概念验证”。只有在人工智能的性能准确性、可靠性和安全性得到证实后,提出的医疗应用才会有用。在纳入了某种形式的绩效评估的64项研究(52.9%)中,大多数评估是主观的(34/ 64,53.1%),只有30项(46.9%)使用了客观的验证技术。另外39篇(17.6%)是在ChatGPT辅助下撰写的病例报告,不适用于医疗实践。222篇文章中只有30篇(13.5%)提出、实施并客观评估了ChatGPT在潜在医疗应用中的性能,其余86.5%的文献几乎没有科学价值。目前,这一新兴领域低于科学出版标准,但每月有513.2次引用,因此人们对这一主题的信息有强烈的兴趣。关于理论应用的评论和给编辑的信是发展思想的灵感,但不构成证据。

综上, AI在医学领域应用的假设需要被验证。只有这样,AI在医学领域的应用才能符合必要的安全法规,并取得实质性进展。

原始出处:

Abi-Rafeh J, Xu HH, Kazan R, Furnas HJ. Medical Applications of Artificial Intelligence and Large Language Models: Bibliometric Analysis and Stern Call for Improved Publishing Practices. Aesthet Surg J. 2023;43(12):NP1098-NP1100. doi:10.1093/asj/sjad277



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题

相关资讯

AlphaFold最新版——开启数字生物学时代来临! 预测几乎所有分子结构,带来药物研发新范式

大约五年前,DeepMind推出了AlphaFold,一个可以准确预测人体内许多蛋白质结构的人工智能系统,震惊全世界。后来很快又推出AlphaFold 2,进一步提高性能。2022年7月28日,Dee

ASN 2023:人工智能:肾衰竭最新预测模型(CureGN 研究)

机器学习通过纳入新的数据模型,提高了对肾衰竭的预测能力。在 CureGN研究 中,这些数据的加入提高了肾衰竭的预测,并检测出取代传统风险因素的新的预测因子。

Quant Imaging Med Surg:人工智能与放射科医生在基于计算机断层扫描图像的骨折检测的准确性分析

撕脱性骨折也是最常见的漏诊,延迟诊断导致更高的诉讼率。因此,本研究基于计算机断层扫描(CT)图像,评估优化前后人工智能(AI)模型的诊断效率,并与放射科医生的诊断效率进行比较,特别是对撕脱性骨折的诊断

JAMA Dermatol:从非标准化的互联网临床照片中汇聚黑色素瘤与痣的数据宝库

在创建的数据集上训练的神经网络比在预先存在的数据集上训练的神经网络表现更好。

【佳作推荐】 百度科研团队NMI期刊论文:一种使用蛋白质语言模型进行结构预测的新方法

作者提出了一种无需MSA搜索的蛋白质结构预测方法——HelixFold-Single。

Eur Urol Focus:患者对基于人工智能的局部前列腺癌决策的信任情况:一项前瞻性试验的结果

研究人员分析了患者对人工智能的信任度、对泌尿科医生使用人工智能的看法,以及未来人工智能在诊断和治疗方面的应用。