Pediatric Nephrology:ChatGPT 在罕见肾脏病信息传递中的准确性、实用性与应用局限

时间:2025-09-14 12:13:14   热度:37.1℃   作者:网络

随着人工智能技术的快速发展,以ChatGPT为代表的大语言模型在医疗信息传递领域展现出广阔的应用前景。罕见肾脏病虽然在单一病种上患者数量稀少,但整体而言,其患者群体在欧洲及全球范围内可达数百万人,占慢性肾脏病患者的5%至10%,尤其在儿童慢性肾脏病患者中几乎全部由罕见病构成。由于专业医生稀缺,患者及其家庭往往难以获得准确、及时且易于理解的疾病信息,转而依赖互联网甚至社交媒体,这大大增加了接触错误信息的风险。因此,探索如何利用人工智能技术弥补这一信息鸿沟,成为当前医学信息学与临床实践相结合的重要课题。

为了系统评估ChatGPT在罕见肾脏病信息提供中的准确性与实用性,欧洲罕见肾脏病参考网络(ERKNet)开展了一项多中心探索性研究。该研究共邀请了42名ERKNet专家(包括小儿肾脏科医生、成人肾脏科医生、遗传学家及病理学家等)以及12名来自欧洲患者倡导组织(ePAG)的代表,覆盖德国、荷兰、意大利、西班牙等13个国家。参与者通过Microsoft Forms问卷平台与ChatGPT 3.5或4.0版本进行模拟医患对话,在对话前统一使用提示语要求模型以非医学背景的普通用户为对象进行回应。每位参与者自选一种熟悉的罕见肾脏病,并依次提出八个标准问题,涵盖疾病解释、预后担忧、基因检测建议、饮食与补充剂、替代疗法、寻找第二意见的医疗资源、其他可靠信息来源以及用通俗语言解释疾病等方面。专家还需提出一至两个专业水平的问题或情感类情境挑战模型回答能力。所有回复由参与者从科学正确性和对患者的有用性两个维度进行评分,评分采用1至5分的等级量表。

研究共收集到54份有效回复,涉及28种不同的罕见肾脏病,包括非典型溶血尿毒综合征、常染色体隐性多囊肾病、胱氨酸贮积症、肾病综合征等常见类型。在科学正确性方面,ChatGPT对疾病基本解释、预后信息及基因检测建议的回答中位数评分均为4分(满分5分),表明其回答与当前临床知识高度一致。在有用性方面,患者与家属对这些回复也普遍持积极态度,评分同样达到4分。尤其值得注意的是,ChatGPT在回答专业级问题时也表现出较强的能力,中位数正确性评分达4分,仅极个别案例中出现建议不够及时或可能误导的情况,例如在肾性尿崩症中建议出现脱水体征再就医,被专家指出存在安全隐患。然而,在涉及替代疗法、第二意见医生推荐以及其他信息资源推荐等问题上,ChatGPT的回答普遍较为模糊、泛化甚至包含不具证据支持的内容(如推荐草药或心智技巧),因此在这些项目上评分中性(中位数3分),未获得专家和患者代表的肯定。

表1 ChatGPT回答的“科学正确性”与“有用性”评价

除了具体问题回答的评估,研究还调查了参与者对ChatGPT整体性能的看法。多数专家认为ChatGPT在帮助罕见肾病患者方面具有潜力,且回答表现出一定同理心,但在安全性方面仍持保留态度,中位数评分仅为3分,处于中性水平。ePAG代表对模型在情感支持场景中的表现评价也较为中立,反映出当前生成式人工智能在复杂情感交互和敏感医疗建议方面仍有局限。许多参与者特别指出,ChatGPT倾向于推荐美国地区的医疗资源(如梅奥诊所),而忽略了欧洲本地的专业机构如ERKNet、欧洲儿科肾脏学会等,这限制了其在实际应用中的地域适应性。此外,部分回答中使用了过多专业术语,对普通患者而言理解起来仍有困难。

尽管存在上述局限,ChatGPT在提供罕见肾脏病相关信息方面仍表现出显著的技术优势,尤其是在整合和传递疾病基础知识、遗传咨询和预后信息方面准确性较高,未出现严重错误或具有直接危害的回答。研究者强调,由于大语言模型存在“幻觉”现象(即模型生成不准确或虚构内容),且其训练数据来源不透明,目前仍不能完全替代专业医疗人员的判断。因此,在实际应用中必须结合人工监督,避免患者因依赖模型建议而延误治疗或采纳非循证疗法。

图 54名ERKNet专家和ePAG代表选出的28种罕见肾脏病

为进一步优化ChatGPT在患者教育中的应用,研究团队提出了一系列提问策略建议,包括要求模型提供来自世界卫生组织或国家卫生机构的可靠信息、明确请求科学证实的治疗方案、根据用户教育背景调整语言复杂度,以及加入地域上下文以提高回答的相关性。目前,ERKNet已启动一项新项目,旨在开发基于精细标注数据训练的专业大语言模型,以更精准地服务于罕见肾脏病患者的信息需求,并在高风险场景中引入“人在回路”机制以保障安全性。

综上所述,ChatGPT作为辅助工具在提升罕见肾脏病患者知识获取和医患沟通效率方面具备重要价值,但其应用仍需谨慎,结合专业医疗指导才能发挥最大效益。未来的研究可进一步拓展至多语言环境和文化适应性分析,以推动人工智能在全球健康信息服务中的公平与包容发展。

原始出处:

van Eerde, A.M., Teixeira, A., Galletti, F. et al. Risks and benefits of ChatGPT in informing patients and families with rare kidney diseases: an explorative assessment by the European Rare Kidney Disease Reference Network (ERKNet). Pediatr Nephrol 40, 2899–2905 (2025). https://doi.org/10.1007/s00467-025-06746-w

本文相关学术信息由梅斯医学提供,基于自主研发的人工智能学术机器人完成翻译后邀请临床医师进行再次校对。如有内容上的不准确请留言给我们。

上一篇: 半年狂喝水、夜尿频繁,家长以为只是‘爱喝...

下一篇: Science Advances:天津医...


 本站广告