大型语言模型在眼科中的应用
关键词
摘要
全文
文章亮点
1.关键发现
- 提出了“人机协同”的未来诊疗新观点。
2.已知与发现
- 回顾了大型语言模型(large language models)在眼科中的应用,其可以帮助医生进行繁琐的病历书写,让医生将更多的精力放在患者病情的分析上。LLMs可以辅助医生快速进行诊断给出治疗意见并提供文献参考。
3.意义与改变
- 基于“人机协同”的未来新模式,以后医生的工作除了诊疗之外,还需要和人工智能(artificial intelligence)工程师密切配合不断优化AI模型。AI帮助医生处理繁琐、重复、机械性的工作,让医生将更多精力放在疾病的研究中,研究出的新技术、新知识又可以导入AI模型进行优化,提升AI模型的诊疗能力。
1 大型语言模型的技术背景
2 大型语言模型在眼科的具体应用
2.1 疾病分诊评估与患者教育
2.1.1 疾病分诊评估
2.1.2 疾病教育
2.2 辅助诊断与治疗
2.2.1 辅助诊断
2.2.2 辅助治疗
2.3 医疗记录管理与数据分析
2.3.1 医疗记录
2.3.2 数据分析
表1 大型语言模型在眼科中的应用
Table 1 The application of large language models (LLMs) in ophthalmology
|
LLMs任务 |
论文 |
年份 |
LLMs版本 |
结果 |
优缺点 |
|
|
眼科感染性疾病 |
ChatGPT用于记录眼科感染性疾病 |
Masalkhi M, Ong J, Waisberg E, et al. ChatGPT to document ocular infectious diseases[11] |
2024 |
ChatGPT |
ChatGPT在眼科感染性疾病的记录和管理中能够提高效率。它能够快速生成病历记录,帮助医生系统整理患者信息,尤其在诊断和治疗方案的记录中表现突出 |
优点:提高了眼科诊疗过程的效率,节省了医生的时间,有助于标准化病历记录。缺点:自动生成的病历内容可能缺乏个性化,且仍需人工检查以确保准确性 |
|
眼科疾病分诊 |
使用GPT-4进行眼科疾病的分诊 |
Waisberg E, Ong J, Zaman N, et al. GPT-4 for triaging ophthalmic symptoms[12] |
2023 |
GPT-4 |
研究GPT-4在眼科症状筛查中的应用,表明GPT-4能够有效识别患者的眼科症状并提供初步分诊建议。研究发现,GPT-4在常见眼科疾病的初步诊断中表现出色,准确率较高 |
优点:提高了分诊效率,减少了医生的负担,能够提供快速的初步诊断意见。缺点:对于复杂病例的判断仍然存在一定限制,依赖于输入的症状信息质量 |
|
眼科疾病诊断与分诊 |
GPT-4与Bard在眼科疾病诊断及分诊中的对比 |
Zandi R, Fahey JD, Drakopoulos M, et al. Exploring diagnostic precision and triage proficiency: a comparative study of GPT-4 and Bard in addressing common ophthalmic complaints[13] |
2024 |
GPT-4, Bard |
比较了GPT-4和Bard在眼科常见疾病上的诊断精度和分诊能力。结果显示,GPT-4和Bard的分诊准确率分别为96.3%和83.8%;GPT-4回答的满意度明显高于Bard(分别为 81.3%和55.0%) |
优点:提高了分诊和诊断效率,提供了较为精准的疾病预测。缺点:不同语言模型在处理特定领域时可能存在性能差异,模型的可解释性仍然有限 |
|
眼科白内障 |
对比ChatGPT与Dr.Google在患者问题中的解答 |
Cohen SA, Brant A, Fisher AC, et al. Dr. Google vs. Dr. ChatGPT: Exploring the Use of Artificial Intelligence in Ophthalmology by Comparing the Accuracy, Safety, and Readability of Responses to Frequently Asked Patient Questions Regarding Cataracts and Cataract Surgery[14] |
2024 |
ChatGPT |
比较了ChatGPT与Dr.Google对常见白内障手术问题的回答,结果表明ChatGPT的回答在准确性、安全性和易读性方面明显优于Dr.Google |
优点:ChatGPT提供的答案更加精准、简洁,且符合医学伦理。缺点:对于一些患者来说,ChatGPT的答案可能过于简化,缺少详细的解释或进一步的医疗建议 |
|
白内障术后 |
使用ChatGPT优化白内障术后管理 |
Waisberg E, Ong J, Masalkhi M, et al. Chat Generative Pretrained Transformer to optimize accessibility for cataract surgery postoperative management[18] |
2023 |
ChatGPT |
探讨了ChatGPT如何帮助白内障术后的患者管理,尤其在解答患者疑问、提供术后护理指导和增加术后管理可行性方面的潜力。结果表明,ChatGPT能够提供及时、准确的术后信息,有效提高患者的依从性 |
优点:提高患者在术后护理过程中的参与度,确保患者能及时获得正确的术后信息。缺点:对于某些复杂或个性化的术后问题,ChatGPT的回答可能不够精准或缺乏深度 |
|
白内障术后 |
LLMs解答白内障患者术后问题 |
Chowdhury M, Lim E, Higham A, et al. Can Large Language Models Safely Address Patient Questions Following Cataract Surgery?[19] |
2023 |
ChatGPT |
LLMs能够提供准确的术后护理指导,尤其在常见问题上表现良好,但在个别病例中可能存在误解风险。在包含120名患者的131个问题中,回答被评为有帮助:59.9%;比较有帮助:36.3% |
优点:提供了及时的术后解答,减少了患者等待时间,提高了患者满意度。缺点:在复杂或非典型病例中,LLMs可能无法提供完全正确的解答,且缺乏临床医生的个性化指导 |
|
罕见眼病诊断 |
GPT-4在罕见眼病诊断中的应用 |
Hu X, Ran AR, Nguyen TX, et al. What can GPT-4 do for diagnosing rare eye diseases? A pilot study[22] |
2023 |
GPT-4 |
研究探讨了GPT-4在罕见眼病诊断中的表现,结果显示在30份回复中,GPT-4 在模拟患者场景中通常诊断不明确,在模拟家庭医生场景中,GPT-4的回答有50%准确率,而在模拟眼科医生的场景中,实现了90%的准确率 |
优点:GPT-4能够协助眼科医生诊断罕见疾病,增加了诊断的准确性。缺点:模型对极为罕见或复杂病例的理解能力有限,仍需医生的最终判断 |
|
角膜病诊断 |
ChatGPT在角膜病诊断中的表现 |
Delsoz M, Madadi Y, Raja H, et al. Performance of ChatGPT in diagnosis of corneal eye diseases[23] |
2024 |
ChatGPT |
结果表明GPT-4的诊断准确率为85%,而GPT-3.5的准确率为60%;GPT-4和3位角膜病专家之间的诊断一致性分别为80%,而GPT-3.5与3位角膜病专家之间的诊断一致性为60% |
优点:提高了眼科疾病诊断的效率,尤其在常见病例中能够提供有价值的辅助意见。缺点:对于复杂或少见的角膜疾病,模型的准确性较低,仍需要专家验证 |
|
青光眼诊断 |
ChatGPT辅助诊断青光眼的能力 |
Delsoz M, Raja H, Madadi Y, et al. The use of ChatGPT to assist in diagnosing glaucoma based on clinical case reports[24] |
2023 |
ChatGPT |
研究探讨了ChatGPT在青光眼诊断中的应用,结果表明诊断准确率,ChatGPT:72.7%(11 例中有8例);3名眼科医师分别为:54.5% (6 例)、72.7% (8 例)和 72.7%(8 例) |
优点:能迅速处理大量病例,提供初步诊断建议,节省时间。缺点:对细节的捕捉不如专业眼科医生精确,存在误诊风险 |
|
视网膜血管疾病 |
ChatGPT在视网膜血管疾病中的应用 |
Liu X, Wu J, Shao A, et al. Uncovering language disparity of ChatGPT on retinal vascular disease classification: cross-sectional study[25] |
2024 |
ChatGPT |
研究表明ChatGPT在视网膜血管疾病中的语言差异,中文诊断准确率:75.03%;英文诊断精确率:79.61%。表明模型在处理不同语言的病例时可能存在性能差异 |
优点:揭示了ChatGPT在处理视网膜血管疾病时可能存在的语言偏差,提升了模型在多元化数据集中的可适应性。缺点:依赖于训练数据的多样性,模型的偏差可能影响某些地区的诊断准确性 |
|
神经眼科疾病 |
ChatGPT协助诊断神经眼科疾病 |
Madadi Y, Delsoz M, Lao PA, et al. ChatGPT assisting diagnosis of neuro-ophthalmology diseases based on case reports[26] |
2023 |
GPT-3.5、 GPT-4 |
诊断准确率:ChatGPT v3.5:13(59%),ChatGPT Plus v4.0:18(82%); |
优点:提高了诊断效率和准确性,尤其对常见病例具有较高的识别率。缺点:对于复杂的少见的神经眼科疾病,ChatGPT的识别和诊断准确度较低 |
|
视网膜疾病 |
ChatGPT-4生成视网膜疾病手术治疗建议 |
Momenaei B, Wakabayashi T, Shahlaee A, et al. Appropriateness and readability of ChatGPT-4-generated responses for surgical treatment of retinal diseases[27] |
2023 |
GPT-4 |
结果表明:GPT-4生成的视网膜疾病手术治疗建议的可靠性:视网膜脱离为84.6%(33/39)、黄斑裂孔92%(23/25)、黄斑前膜91.7%(22/24) |
优点:生成的治疗建议通常易于理解和执行,有助于快速获取治疗方案。缺点:对于复杂病例或个性化治疗方案,模型的建议可能不够精准或未能考虑患者的独特需求 |
|
眼科考试 |
ChatGPT在欧洲眼科医学考试中的表现 |
Panthier C, Gatinel D. Success of ChatGPT, an AI language model, in taking the French language version of the European Board of Ophthalmology examination: A novel approach to medical knowledge assessment[28] |
2023 |
ChatGPT |
结果表明,ChatGPT 在眼科考试中取得了91%的成功率。ChatGPT在眼科知识考试中的表现超出了预期,成功通过了多个部分,表明其在医学知识评估中的潜力 |
优点:能够高效评估医学知识,尤其是在标准化考试中表现突出。缺点:仍然存在一定的答题不准确和对复杂临床情境的理解不足的情况 |
|
眼科术后并发症 |
GPT-4在记录眼科术后并发症中的应用 |
Waisberg E, Ong J, Masalkhi M, et al. GPT-4 to document ophthalmic post-operative complications[29] |
2024 |
GPT-4 |
研究评估了GPT-4在眼科术后并发症文档记录中的应用。结果表明,GPT-4能够有效地记录术后并发症,并提供清晰、结构化的文档,但在处理某些细节和个别病例时,仍存在一定的偏差 |
优点:提高了记录效率,减少了医生在术后文档记录上的工作负担。缺点:在复杂病例中,GPT-4可能忽略细节或生成不够准确的记录 |
|
眼科出院总结和手术记录 |
ChatGPT在眼科出院总结和手术记录中的应用 |
Singh S, Djalilian A, Ali MJ. ChatGPT and ophthalmology: exploring its potential with discharge summaries and operative notes[30] |
2023 |
ChatGPT |
研究探讨了ChatGPT在生成眼科出院总结和手术记录中的潜力。研究表明,ChatGPT能够高效地生成标准化的出院总结和手术记录,但在涉及复杂病例或个性化细节时,生成的记录可能需要进一步的审查和修正 |
|
|
眼科急诊 |
LLMs在眼科急诊中的应用 |
Khan S, Gunasekera C. Comparative Analysis of Large Language Models against the NHS 111 Online Triaging for Emergency Ophthalmology[32] |
2024 |
GPT-3.5、GPT-4.0、Bard、Bing Chat |
研究对比了大型语言模型与NHS 111在线急诊分诊系统在眼科急诊中的表现。结果表明,LLMs的回答中有93%的回答被评为“良好”,33%的回答被评为“非常好”,所有回答中没有任何可能对患者健康有害的错误信息或建议 |
优点:提高了急诊分诊效率,减少了医生的负担。缺点:对于复杂病例,LLMs可能无法提供准确的分诊建议 |
|
眼科手术记录 |
GPT-4在眼科手术记录中的应用 |
Waisberg E, Ong J, Masalkhi M, et al. GPT-4 and ophthalmology operative notes[40] |
2023 |
GPT-4 |
研究探讨了GPT-4在生成眼科手术记录中的应用。结果表明,GPT-4能够生成准确、清晰的手术记录,并提高了记录的效率,但仍需进一步提高对复杂手术流程的理解和细节处理能力 |
优点:提高了手术记录生成效率,减轻了文档书写负担。缺点:在处理复杂或特殊手术时,GPT-4可能忽略一些细节或生成不准确的记录 |
|
眼科辅助检查 |
ChatGPT用于生成吲哚青绿血管造影报告 |
Chen X, Zhang W, Zhao Z, et al. ICGA-GPT: report generation and question answering for indocyanine green angiography images[41] |
2024 |
ChatGPT |
研究介绍了ICGA-GPT,这是一种基于GPT的大型语言模型,用于生成吲哚菁绿血管造影报告并回答相关问题。研究表明,ICGA-GPT能够高效生成详细且准确的报告,并为医生提供有关图像的实时问题解答 |
优点:提高了吲哚菁绿血管造影图像分析的效率,支持实时解答。缺点:对于复杂的图像和案例,模型的解答可能不够精确 |
|
眼科领域 |
LLMs在眼科研究和临床中的应用 |
Yang Z, Wang D, Zhou F, et al. Understanding natural language: Potential application of large language models to ophthalmology[44] |
2024 |
ChatGPT、Co-Pilot、ChatGLM、Gemini等 |
LLMs可以帮助眼科医生进行文献综述、症状分析,甚至在临床诊断中通过分析病历和相关研究辅助决策 |
优点:能实时支持决策、提供基于文献的建议,提高诊断速度和准确性。缺点:对复杂的眼科病例理解有限,如果训练数据不完整或存在偏差,可能导致错误 |
|
眼科领域 |
数据库增强的LLMs框架可以提供更好的眼科决策支持 |
Luo M J, Pang J, Bi S, et al. Development and evaluation of a retrieval-augmented large language model framework for ophthalmology[45] |
2024 |
ChatZOC、GPT-3.5、GPT-4.0 |
扩充了眼科数据库的增强大型语言模型ChatZOC能够提供更准确的治疗建议 |
优点:增强LLMs可以提供更准确的建议。缺点:计算复杂度较高,依赖外部数据库的质量,实践应用中存在一定挑战 |