谷歌Gemini-SQL2大幅領先文本轉SQL基準測試

谷歌基於Gemini 3.1 Pro的模型在BIRD基準測試中準確率達80.04%，領先OpenAI和Anthropic。

谷歌研究院近日公佈了其最新的文本轉SQL系統Gemini-SQL2，該系統基於Gemini 3.1 Pro構建，專門用於將自然語言指令轉化為可執行的SQL資料庫查詢。在衡量此類翻譯準確度的權威基準測試BIRD上，Gemini-SQL2以80.04%的執行準確率拔得頭籌，拉開了與主要競爭對手的差距。

根據谷歌公佈的資料，OpenAI的GPT-5.5-xhigh在同一測試中的準確率約為72.8%，Anthropic的Claude Opus 4.6約為70.9%，而來自Databricks、亞馬遜雲服務、騰訊和阿里巴巴的模型則落後更多。這一成績單清晰地展示了谷歌在該細分領域的技術優勢。

文本轉SQL的難點在於，真實世界的資料庫往往結構複雜、層級巢狀，查詢語句需要準確理解業務邏輯才能生成既語法正確又能成功執行的程式碼。谷歌研究院指出，Gemini-SQL2生成的SQL查詢不僅在形式上正確，更關鍵的是能夠順利執行並返回預期結果，這意味著系統對查詢意圖的把握達到了較高水平。

從產業角度看，這項技術直接關係到企業資料服務的智慧化程度。大量商業資料儲存在關係型資料庫中，而能夠用自然語言直接查詢這些資料，將大幅降低資料分析的門檻，讓非技術背景的業務人員也能直接與資料對話。谷歌方面表示，更強的SQL理解能力有望更廣泛地改善其資料服務中的自然語言功能，這暗示著該技術未來可能被整合進谷歌雲的資料分析產品線，例如BigQuery等核心服務。

值得注意的是，目前谷歌研究團隊尚未透露該模型是否會公開發布，也沒有釋出相關論文。這意味著Gemini-SQL2仍處於研究展示階段，距離商業化落地還有一段路要走。不過，考慮到谷歌在雲端計算市場與亞馬遜、微軟的激烈競爭，任何能夠增強其資料服務差異化競爭力的技術儲備都值得關注。

在AI產業版圖中，文本轉SQL屬於模型能力向企業級應用場景延伸的典型案例。它不像通用聊天機器人那樣面向大眾使用者，而是直接切入資料庫查詢這一高頻剛需，解決的是企業資料民主化的實際問題。如果此類技術成熟併產品化，可能會改變企業內部資料使用的方式，讓更多人能夠繞過SQL學習曲線，直接通過自然語言獲取資料洞察。

當前，OpenAI和Anthropic等競爭對手也在持續提升各自模型在結構化查詢方面的能力，但Gemini-SQL2在BIRD基準上的領先幅度表明，谷歌在特定垂直任務上的模型最佳化取得了實質性進展。未來該領域的競爭可能會從通用對話能力轉向更多細分專業任務的比拼，而基準測試的分數變化將成為觀察各家技術進展的重要視窗。

谷歌Gemini-SQL2大幅領先文本轉SQL基準測試

延伸閱讀

相關深度報道

相關每日新聞