Google 入稟控告網絡爬蟲公司 SerpApi 指其繞過安全措施盜取搜尋結果

Published by
藍骨

Google 入稟控告提供網絡內容抓取工具公司 SerpApi,指控對方違反《版權法》,以欺騙手段自動存取並以驚人規模抓取 Google 搜尋結果,然後將數據出售給客戶。Google 於 12 月 19 日提交的訴訟文件顯示,SerpApi 每日向 Google 發送數億次假冒搜尋請求,模仿真人用戶行為以繞過安全防護。

 

SearchGuard 技術遭破解 Google 投資數百萬美元研發

訴訟核心是 Google SearchGuard 技術,這是一項於 2025 年 1 月推出保護措施,耗費數萬工時及數百萬美元投資開發。SearchGuard 會向來自不明來源搜尋查詢發送 JavaScript 挑戰,要求瀏覽器傳送特定資訊,以證明請求來自真人用戶而非自動化系統。正常用戶瀏覽器可無縫解決這些挑戰,但自動化抓取工具通常無法存取搜尋結果及當中版權作品。

 

Google 在訴訟中表示,SearchGuard 在 2025 年 1 月推出時有效阻止 SerpApi 存取 Google 搜尋結果及合作夥伴版權內容,但 SerpApi 隨即著手研發繞過這項技術保護措施方法,並迅速發現破解方法及部署相關技術。

 

創辦人自述製造假冒瀏覽器 使用大量 IP 地址

SerpApi 應對 SearchGuard 方法是掩飾每日向 Google 發送數億次自動化查詢,令這些請求看似來自真人用戶。SerpApi 創辦人 Ilyass Khaleghy 近日形容這個過程為「利用大量 IP 地址製造假冒瀏覽器,讓 Google 視之為正常用戶」。

 

根據訴訟文件,SerpApi 在提交自動化查詢及接收 SearchGuard 挑戰時,可能會謊報查詢發出裝置、軟件或位置,以解決挑戰並獲得授權。另一個方法是利用合法請求解決挑戰,然後將所得授權分發到全球未經授權機器,令假冒瀏覽器產生自動化查詢看似已獲 Google 授權。公司亦使用自動化手段繞過 CAPTCHA,這是 SearchGuard 另一個用於測試用戶是否真人元件。

 

SerpApi 技術水平在公司自家營銷材料中顯而易見。最近一篇網誌文章解釋,SearchGuard 令網絡爬蟲更加困難,但聲稱公司有幸只受到最低程度影響,因為服務已預先解決 Google JavaScript 挑戰。當 Google 其後提高 SearchGuard 難度時,SerpApi 承認曾短暫中斷,但有賴工程師團隊全力投入,很快便能解決問題。

 

指 SerpApi 商業模式寄生 損害版權內容授權

Google 形容 SerpApi 商業模式是寄生性質,指 SerpApi 使用自動化手段抓取其他服務內容,產生數十億次人工請求,然後複製及出售回應內容。SerpApi 並無就抓取輸出內容或其自動化程式對服務電腦基礎設施造成龐大負擔成本向這些服務作出補償。其抓取行為一律違反服務管理協議,並無視這些服務透過 robots.txt 指令向自動化爬蟲或機械人傳達存取限制。

 

Google 主張其搜尋結果包含大量版權內容,包括圖片,這些內容在搜尋不同模組中顯示,例如知識面板。Google 指 SerpApi 破壞其在授權顯示版權材料方面投資,令其他毋須承擔類似成本服務也能取得內容。

 

SerpApi 向第三方出售「Google Search API」服務,月費由 75 美元至 275 美元不等(約港幣 585 元至 2,145 元)。Google 認為這具誤導性,因為 Google 並無為這類數據提供公共搜尋 API,SerpApi 本質上是出售 Google 專有搜尋引擎後門。

 

Reddit 同樣起訴 SerpApi 涉及 Perplexity AI

Reddit 亦於 10 月入稟控告 SerpApi 及另外兩家數據抓取公司,指控至少一家從其網站抓取內容供 AI 初創企業 Perplexity 使用。雖然 Google 訴訟簡要提及 Reddit 針對 SerpApi 訴訟,但並無直接提及 Perplexity 或 AI 機械人。

 

Reddit 訴訟指出,在 2025 年 7 月兩週期間,被告繞過 Google 技術障礙,非法存取近 30 億個充滿 Reddit 文字、連結、相片及影片搜尋引擎結果頁面。Reddit 表示,Perplexity 在收到停止函後,引用 Reddit 次數激增 40 倍,由於 Perplexity 是 SerpApi 推廣客戶,顯然可知其從何處及如何取得這些未經授權 Reddit 數據。

 

Google 要求法院下令停止並銷毀相關技術

Google 主張其安全系統(如 SearchGuard)屬於控制存取版權作品技術措施,繞過這些措施涉嫌違反《數碼千禧年版權法》(DMCA)第 1201 條。Google 聲稱 SerpApi 違反 Google 服務條款,該條款嚴格禁止自動化抓取及使用代理伺服器隱藏身份,並指 SerpApi 在未對生態系統作出貢獻或遵守規則情況下,從 Google 組織全球資訊龐大投資中獲利。

 

Google 要求法院下令 SerpApi 停止繞過其反抓取限制,並銷毀涉及該過程任何技術。Google 有權從 SerpApi 追討其因對方違反法例而遭受實際損失,以及 SerpApi 從中賺取的任何額外非重複利潤,或可選擇追討法定賠償,每次違法行為賠償額不少於 200 美元(約港幣 1,560 元)及最多 2,500 美元(約港幣 19,500 元)。

 

來源:Google

Published by
藍骨