中医临床决策５款大语言模型，谁主沉浮？-编程实验室

背景

中医临床决策需整合辨证论治、体质评估与个体化方药，难以标准化与质控。大语言模型具备医学知识整合与临床推理能力，但其在中医领域的应用，尤其在辨证与组方方面，仍未被充分探索。

目的

本研究评估5种主流大语言模型在中医临床决策中的表现，并对比人机协作与独立决策模式的效果。具体目标为：评测模型的中医知识水平、评估临床案例分析能力、筛选最优模型、评价人机协作的决策质量、效率与接受度。

方法

选取5种模型（Claude 3.7 Sonnet-Extended、ChatGPT 4.5、Grok3-DeepSearch、Gemini 2.0 Flash Thinking Experimental、DeepSeek-R1），通过４阶段评估：

(1) 160道标准化中医知识题考核；

(2) 30例不同系统、不同复杂度临床案例分析；

(3) 加权计分筛选最优模型（知识占40%，临床分析占60%）；

(4) 10名中医师与2名专家参与，对比纯医师、纯 AI、人机协作３组在5例临床案例中的表现。统计方法包括描述性统计、信度分析、组间比较与回归分析。

大语言模型的选取与配置

表1大语言模型特性与配置详情

所有模型均在2025年3月测试期间通过官方接口或网页界面以标准配置访问。TCM：中医学；RL：强化学习；SFT：监督微调。

结果

DeepSeek-R1在２方面均最优，知识考核准确率96.7%，临床案例评分17.31/20（SD 2.65），显著优于其他模型（P<0.001）。人机协作较医师独立决策显著提升：质量提高16.1%（33.62 vs 28.97；P<0.001），耗时减少66.1%（162.6 s vs 479.2 s；P<0.001）。系统可用性评分良好（系统可用性量表76.8分；P=0.002），接受度高（采纳74.25%、修改24%、拒绝1.75%）。AI辅助在方剂配伍与药物选择环节获益最大（P<0.001）。

模型整体表现

表2 各模型中医知识考核表现

基于中医执业资格考试160道单选题，每题重复测试3次（每模型总应答480次）；所有模型整体比较的Friedman检验P<0.001。

疾病系统与难度分层分析

图1中医知识评估中3种难度层级的模型准确率

案例分析总体评分

表3各模型及各评估维度的临床案例分析表现

基于中医执业资格考试标准评估30例临床案例（15例简单、15例复杂），数据为均值（标准差）；总分为20分；疾病诊断、证候诊断、病位鉴别、药物组成满分3分；辨证依据满分4分；治法、方剂名称满分2分；模型整体比较的单因素方差分析P<0.001。

按评估维度分层的表现

图2 5种大语言模型各评估维度的临床案例分析表现

雷达图

质量对比分析

表4临床案例分析中不同决策模式的对比

基于5例不同疾病系统、不同复杂度的临床案例；AI：人工智能；效应量采用Cohen d值（小0.2、中0.5、大0.8）；主要比较为人机协作vs纯医师。

效率分析

图3 3种决策模式的质量与效率对比

所有模型均在2025年3月测试期间通过官方接口或网页界面以标准配置访问。

临床应用价值与医师体验

表5统可用性评估与医师体验评价

基于10名具有5年以上临床经验的中医师反馈；评分等级：1.0–2.4差，2.5–3.4中等，3.5–4.4良好，4.5–5.0优秀；系统可用性量表与68分基线比较的单样本t检验：t=4.433，P=0.002。

系统可用性与协作模式分析

图4 各临床决策领域的人机协作模式

结论

大语言模型（尤其是DeepSeek-R1）在中医知识考核与临床案例分析中表现优异。人机协作显著提升中医临床决策质量与效率，医师接受度高。该结果为中医AI辅助决策的临床价值提供了实证依据，有望解决中医知识标准化、临床培训与诊疗效率的核心痛点。

详细总结

思维导图（mindmap）

4阶段评估体系

大语言模型知识考核结果

人机协作核心效果

参考

JMIR Form Res. 2026 Mar 2:10:e80167. doi: 10.2196/80167.

Digitally Assisted Clinical Decision-Making in Traditional Chinese Medicine: Comparative Study of 5 Large Language Models

260302TCM_5LLMs.pdf

注：AI辅助创作，如有不当欢迎指出。内容仅供参考，不构成任何建议。

终极指南：如何用OpenColorIO-Config-ACES构建专业色彩管理

终极指南：如何用OpenColorIO-Config-ACES构建专业色彩管理【免费下载链接】OpenColorIO-Config-ACES 项目地址: https://gitcode.com/gh_mirrors/op/OpenColorIO-Config-ACES OpenColorIO-Config-ACES是一款专为影视后期、动画制作和视觉特效行业设计的开源…

李华

米牛图片搬运去重大师手机版使用教程

🔥【米牛图片搬运神器】100%原创过审！流量暴增秘籍，批量去重全能编辑一键搞定！🔥 📢 自媒体/电商人必看！ 还在为图片重复、平台限流而头疼？米牛图片搬运批量去重过审神器重磅来袭&a…

李华

如何高效使用Photoshop图层批量导出神器：5分钟快速入门完整指南

如何高效使用Photoshop图层批量导出神器：5分钟快速入门完整指南【免费下载链接】Photoshop-Export-Layers-to-Files-Fast This script allows you to export your layers as individual files at a speed much faster than the built-in script from Adobe. 项目…

李华

Deepin Boot Maker：3分钟制作专业级Linux启动盘的终极指南

Deepin Boot Maker：3分钟制作专业级Linux启动盘的终极指南【免费下载链接】deepin-boot-maker 项目地址: https://gitcode.com/gh_mirrors/de/deepin-boot-maker 还在为复杂的Linux启动盘制作而烦恼吗？Deepin Boot Maker正是你需要的解决方案&a…

李华

中医临床决策５款大语言模型，谁主沉浮？

背景

目的

方法

结果

结论

详细总结

参考

PPTist终极指南：免费网页版PPT制作工具的10个超实用技巧

终极指南：如何用OpenColorIO-Config-ACES构建专业色彩管理

米牛图片搬运去重大师手机版使用教程

Visual C++运行库终极指南：一键解决DLL缺失的完整方案

如何高效使用Photoshop图层批量导出神器：5分钟快速入门完整指南

Deepin Boot Maker：3分钟制作专业级Linux启动盘的终极指南