2026年6月17日,頂級學術期刊《自然》刊登了一項可能重塑醫療AI產業格局的研究:一個名為MIRA的自主醫療AI智能體,首次在模擬環境中獨立完成了從問診、檢查到治療、入院的急診全流程診療,診斷準確率顯著超越人類醫師。
這項題為《邁向自主醫療人工智能智能體》的論文,由研究團隊基於MIMIC-IV數據庫中500餘例真實急診病例展開。MIRA並非又一個只會回答醫學問題的聊天機器人,而是被設計為能在沙盒電子健康記錄(EHR)環境中持續採取行動的智能體。它全面兼容FHIR等國際通用醫療數據交互標準,內置11類臨床工具,可執行超過85,000種臨床操作,真正打通了從“建議”到“執行”的壁壘。
在嚴格的人機對照實驗中,MIRA的診斷準確率達到87.8%,不僅遠超混合資歷醫師組的71.1%,也顯著高於持證專科醫師組的78.1%。尤其在闌尾炎和胰腺炎的識別上,其優勢最為突出。更值得關注的是,MIRA在檢查規劃中表現出循證剋制——它並未通過大量開具CT或MRI等高成本影像來換取準確率,主要增加的是低成本常規血液檢查,未發現系統性過度醫療風險。
在治療決策環節,MIRA的手術方案推薦與標準臨床路徑高度吻合。例如,對闌尾炎病例的腹腔鏡闌尾切除術推薦匹配率達到100%。其整體診療規範依從性比人類醫師高出35個百分點。在用藥安全方面,研究未在56份完整病例中觀察到任何高危錯誤,近500條處方信息的準確率接近滿分。
這一突破的背景,是醫療AI長期面臨的“行動鴻溝”。儘管大語言模型在醫學考試中屢獲高分,但它們始終被困在零散的任務片段裡,無法像真實醫生那樣,在電子病歷系統中動態調取信息、開具檢查、整合結果並修正方案。MIRA的核心創新在於,它通過多工具聯動閉環決策,復刻了醫師逐步收集證據、動態調整方案的完整邏輯鏈。
然而,從實驗室到真實病房,MIRA仍有長路要走。當前實驗完全基於歷史病歷文本,無法復現現實中患者表述含糊、信息矛盾等複雜情況。訓練數據MIMIC-IV可能已被部分大模型攝入,導致性能評估存在虛高風險。最關鍵的是,MIRA全程運行在隔離沙盒中,從未對接醫院真實業務系統,面對真實突發狀況的能力尚未檢驗。
當AI被賦予開具處方、安排手術的自主權時,責任劃分與治理體系成為比技術更緊迫的議題。研究團隊明確指出,短期內MIRA更適合作為醫師的協同助手,率先落地於藥物核對、檢驗套餐組合、會診文書撰寫等標準化任務,幫助臨床醫生減輕繁重的文書負擔。所有關鍵決策,包括最終診斷和手術安排,都必須保留醫師強制複核環節。
長遠看,行業需要同步建立統一的准入規範、全流程審計和異常預警機制,確保AI的每一次診療行為都可記錄、可追蹤、可解釋。只有當人機分工、風險監管和行業標準同步成熟,自主醫療智能體才有可能真正走出實驗室,成為緩解醫療資源緊張的重要力量。