谷歌Gemini-SQL2大幅领先文本转SQL基准测试

谷歌基于Gemini 3.1 Pro的模型在BIRD基准测试中准确率达80.04%，领先OpenAI和Anthropic。

谷歌研究院近日公布了其最新的文本转SQL系统Gemini-SQL2，该系统基于Gemini 3.1 Pro构建，专门用于将自然语言指令转化为可执行的SQL数据库查询。在衡量此类翻译准确度的权威基准测试BIRD上，Gemini-SQL2以80.04%的执行准确率拔得头筹，拉开了与主要竞争对手的差距。

根据谷歌公布的数据，OpenAI的GPT-5.5-xhigh在同一测试中的准确率约为72.8%，Anthropic的Claude Opus 4.6约为70.9%，而来自Databricks、亚马逊云服务、腾讯和阿里巴巴的模型则落后更多。这一成绩单清晰地展示了谷歌在该细分领域的技术优势。

文本转SQL的难点在于，真实世界的数据库往往结构复杂、层级嵌套，查询语句需要准确理解业务逻辑才能生成既语法正确又能成功执行的代码。谷歌研究院指出，Gemini-SQL2生成的SQL查询不仅在形式上正确，更关键的是能够顺利执行并返回预期结果，这意味着系统对查询意图的把握达到了较高水平。

从产业角度看，这项技术直接关系到企业数据服务的智能化程度。大量商业数据存储在关系型数据库中，而能够用自然语言直接查询这些数据，将大幅降低数据分析的门槛，让非技术背景的业务人员也能直接与数据对话。谷歌方面表示，更强的SQL理解能力有望更广泛地改善其数据服务中的自然语言功能，这暗示着该技术未来可能被整合进谷歌云的数据分析产品线，例如BigQuery等核心服务。

值得注意的是，目前谷歌研究团队尚未透露该模型是否会公开发布，也没有发布相关论文。这意味着Gemini-SQL2仍处于研究展示阶段，距离商业化落地还有一段路要走。不过，考虑到谷歌在云计算市场与亚马逊、微软的激烈竞争，任何能够增强其数据服务差异化竞争力的技术储备都值得关注。

在AI产业版图中，文本转SQL属于模型能力向企业级应用场景延伸的典型案例。它不像通用聊天机器人那样面向大众用户，而是直接切入数据库查询这一高频刚需，解决的是企业数据民主化的实际问题。如果此类技术成熟并产品化，可能会改变企业内部数据使用的方式，让更多人能够绕过SQL学习曲线，直接通过自然语言获取数据洞察。

当前，OpenAI和Anthropic等竞争对手也在持续提升各自模型在结构化查询方面的能力，但Gemini-SQL2在BIRD基准上的领先幅度表明，谷歌在特定垂直任务上的模型优化取得了实质性进展。未来该领域的竞争可能会从通用对话能力转向更多细分专业任务的比拼，而基准测试的分数变化将成为观察各家技术进展的重要窗口。

谷歌Gemini-SQL2大幅领先文本转SQL基准测试

延伸阅读

相关深度报道

相关每日新闻