谷歌研究院近日公佈了其最新的文本轉SQL系統Gemini-SQL2,該系統基於Gemini 3.1 Pro構建,專門用於將自然語言指令轉化為可執行的SQL數據庫查詢。在衡量此類翻譯準確度的權威基準測試BIRD上,Gemini-SQL2以80.04%的執行準確率拔得頭籌,拉開了與主要競爭對手的差距。

根據谷歌公佈的數據,OpenAI的GPT-5.5-xhigh在同一測試中的準確率約為72.8%,Anthropic的Claude Opus 4.6約為70.9%,而來自Databricks、亞馬遜雲服務、騰訊和阿里巴巴的模型則落後更多。這一成績單清晰地展示了谷歌在該細分領域的技術優勢。

文本轉SQL的難點在於,真實世界的數據庫往往結構複雜、層級嵌套,查詢語句需要準確理解業務邏輯才能生成既語法正確又能成功執行的代碼。谷歌研究院指出,Gemini-SQL2生成的SQL查詢不僅在形式上正確,更關鍵的是能夠順利執行並返回預期結果,這意味著系統對查詢意圖的把握達到了較高水平。

從產業角度看,這項技術直接關係到企業數據服務的智能化程度。大量商業數據存儲在關係型數據庫中,而能夠用自然語言直接查詢這些數據,將大幅降低數據分析的門檻,讓非技術背景的業務人員也能直接與數據對話。谷歌方面表示,更強的SQL理解能力有望更廣泛地改善其數據服務中的自然語言功能,這暗示著該技術未來可能被整合進谷歌雲的數據分析產品線,例如BigQuery等核心服務。

值得注意的是,目前谷歌研究團隊尚未透露該模型是否會公開發布,也沒有發佈相關論文。這意味著Gemini-SQL2仍處於研究展示階段,距離商業化落地還有一段路要走。不過,考慮到谷歌在雲計算市場與亞馬遜、微軟的激烈競爭,任何能夠增強其數據服務差異化競爭力的技術儲備都值得關注。

在AI產業版圖中,文本轉SQL屬於模型能力向企業級應用場景延伸的典型案例。它不像通用聊天機器人那樣面向大眾用戶,而是直接切入數據庫查詢這一高頻剛需,解決的是企業數據民主化的實際問題。如果此類技術成熟併產品化,可能會改變企業內部數據使用的方式,讓更多人能夠繞過SQL學習曲線,直接通過自然語言獲取數據洞察。

當前,OpenAI和Anthropic等競爭對手也在持續提升各自模型在結構化查詢方面的能力,但Gemini-SQL2在BIRD基準上的領先幅度表明,谷歌在特定垂直任務上的模型優化取得了實質性進展。未來該領域的競爭可能會從通用對話能力轉向更多細分專業任務的比拼,而基準測試的分數變化將成為觀察各家技術進展的重要窗口。