英國競爭與市場管理局(CMA)近日針對谷歌的AI搜索功能做出了一項具有里程碑意義的裁決,要求這家科技巨頭必須為在線出版商提供明確的選擇退出機制。根據新規,網站所有者將有權阻止其內容出現在谷歌的AI Overviews等生成式搜索摘要中,同時禁止谷歌在未經許可的情況下,將這些內容用於其AI模型的“微調”訓練。
這項裁決的核心在於賦予內容創作者更大的控制權。過去,谷歌通過爬蟲抓取全網公開內容來訓練其AI模型並生成搜索摘要,出版商往往只能被動接受。CMA的新規打破了這一局面,它強制谷歌在Search Console等工具中提供技術選項,讓網站可以系統性地拒絕被納入AI功能的數據源。這意味著,出版商現在能夠決定自己的新聞、評論或專業知識是否成為AI直接回答的一部分,而不僅僅是控制是否被傳統搜索索引收錄。
CMA此舉的背景是全球範圍內對AI訓練數據版權問題的激烈爭議。新聞媒體、圖片庫和內容平臺長期以來指責大型科技公司無償使用其受版權保護的作品來構建商業AI產品,卻未給予公平補償。英國監管機構此次率先出手,並非孤立事件,而是與歐盟《人工智能法案》中對數據透明度的要求、以及美國多起相關訴訟形成呼應。谷歌此前已在歐盟面臨類似壓力,但CMA的裁決明確將“AI微調”納入監管範圍,這比單純要求披露數據來源更進一步,直接觸及了AI模型迭代升級的原料供應鏈。
從AI產業的角度看,這一裁決的影響將沿著“五層蛋糕”模型向上傳導。在模型層,數據獲取的壁壘正在升高。如果更多司法管轄區效仿英國,要求科技公司為訓練數據獲取明確授權,那麼構建高質量基礎模型的成本將顯著增加,尤其是對於那些依賴多樣化互聯網文本進行微調的模型而言。谷歌、OpenAI等公司可能需要投入更多資源建立合規的數據採購或授權體系,而非依賴傳統的全網爬取模式。
在應用層,AI搜索產品的信息豐富度可能面臨挑戰。若大量優質新聞源選擇退出,AI Overviews的答案質量或將下降,尤其是在時效性強、需要專業分析的領域。這反過來可能削弱AI搜索相對於傳統搜索的用戶價值,為那些已與出版商建立付費合作關係的AI產品(如某些與新聞集團達成協議的聊天機器人)創造差異化優勢。
對於基礎設施與芯片層,短期影響有限,但長期看,數據獲取成本的上升可能促使企業更高效地利用已有數據,推動合成數據生成、小樣本學習等技術的加速發展,這些技術路徑的變化最終會重塑對算力規模和架構的需求。
CMA的裁決還隱含著一個更深層的信號:監管機構正從關注AI輸出的安全性,轉向干預AI輸入的合法性。這為投資者提供了一個觀察窗口——未來AI產業的競爭,可能不再僅僅是算力規模和模型參數的比拼,合規獲取高質量數據的能力將成為新的護城河。那些能夠通過商業協議、而非技術手段鎖定獨家數據源的公司,或許會在下一階段的AI應用競賽中佔據更有利的位置。