2026年6月17日,顶级学术期刊《自然》刊登了一项可能重塑医疗AI产业格局的研究:一个名为MIRA的自主医疗AI智能体,首次在模拟环境中独立完成了从问诊、检查到治疗、入院的急诊全流程诊疗,诊断准确率显著超越人类医师。

这项题为《迈向自主医疗人工智能智能体》的论文,由研究团队基于MIMIC-IV数据库中500余例真实急诊病例展开。MIRA并非又一个只会回答医学问题的聊天机器人,而是被设计为能在沙盒电子健康记录(EHR)环境中持续采取行动的智能体。它全面兼容FHIR等国际通用医疗数据交互标准,内置11类临床工具,可执行超过85,000种临床操作,真正打通了从“建议”到“执行”的壁垒。

在严格的人机对照实验中,MIRA的诊断准确率达到87.8%,不仅远超混合资历医师组的71.1%,也显著高于持证专科医师组的78.1%。尤其在阑尾炎胰腺炎的识别上,其优势最为突出。更值得关注的是,MIRA在检查规划中表现出循证克制——它并未通过大量开具CTMRI等高成本影像来换取准确率,主要增加的是低成本常规血液检查,未发现系统性过度医疗风险。

在治疗决策环节,MIRA的手术方案推荐与标准临床路径高度吻合。例如,对阑尾炎病例的腹腔镜阑尾切除术推荐匹配率达到100%。其整体诊疗规范依从性比人类医师高出35个百分点。在用药安全方面,研究未在56份完整病例中观察到任何高危错误,近500条处方信息的准确率接近满分。

这一突破的背景,是医疗AI长期面临的“行动鸿沟”。尽管大语言模型在医学考试中屡获高分,但它们始终被困在零散的任务片段里,无法像真实医生那样,在电子病历系统中动态调取信息、开具检查、整合结果并修正方案。MIRA的核心创新在于,它通过多工具联动闭环决策,复刻了医师逐步收集证据、动态调整方案的完整逻辑链。

然而,从实验室到真实病房,MIRA仍有长路要走。当前实验完全基于历史病历文本,无法复现现实中患者表述含糊、信息矛盾等复杂情况。训练数据MIMIC-IV可能已被部分大模型摄入,导致性能评估存在虚高风险。最关键的是,MIRA全程运行在隔离沙盒中,从未对接医院真实业务系统,面对真实突发状况的能力尚未检验。

当AI被赋予开具处方、安排手术的自主权时,责任划分与治理体系成为比技术更紧迫的议题。研究团队明确指出,短期内MIRA更适合作为医师的协同助手,率先落地于药物核对、检验套餐组合、会诊文书撰写等标准化任务,帮助临床医生减轻繁重的文书负担。所有关键决策,包括最终诊断和手术安排,都必须保留医师强制复核环节。

长远看,行业需要同步建立统一的准入规范、全流程审计和异常预警机制,确保AI的每一次诊疗行为都可记录、可追踪、可解释。只有当人机分工、风险监管和行业标准同步成熟,自主医疗智能体才有可能真正走出实验室,成为缓解医疗资源紧张的重要力量。