消費調查:OpenAI的新技術對谷歌構成嚴重威脅
谷歌的工作原理是抓取數十億個網頁,對內容進行索引,再將最具相關性的答案進行排序。然后給出一個可供點擊瀏覽的鏈接列表。ChatGPT則為困惑的互聯網用戶提供了他們更感興趣的東西:基于自身搜索和綜合性信息給出的單一答案。ChatGPT已經在數百萬個網站上進行了訓練,不但可以收集進行類似人類對話的技能,還可以收集信息本身,只要信息是2021年底前發布到互聯網上的。
有消費者研究發現,18個查詢當中,ChapGPT有13個答案比谷歌更有用。
“有用”當然具有主觀性。這個詞的含義是什么?在本例當中,指的是答案清晰全面。ChatGPT在關于“煉乳和淡奶哪個更適合做感恩節南瓜派”的問題上給出了詳細(盡管也略顯冗長的)回答,解釋了煉乳可以讓南瓜派更甜。(當然,這樣更好。)谷歌主要提供了一個食譜鏈接的列表,必須點開才能查看,而且沒有明確答案。
這完全彰顯了ChatGPT對谷歌的主要威脅。它給出了單一的即時回應,無需進一步搜尋其他網站。用硅谷的話說,這是一種“無摩擦”體驗,是在網上消費者一邊倒地青睞快捷易用服務之際的一種類似“圣杯”的東西。
當然,對于一些查詢內容,谷歌確實有自己的歸納性答案,但只是排名最靠前網頁的匯總,通常也很簡短。谷歌也有自己的專有語言模型,名為LaMDA,性能優異,以至于該公司的一位工程師認為這個系統擁有自主意識。
那么,谷歌為什么不像ChatGPT那樣,針對查詢生成自己的單一答案呢?原因在于,任何阻止用戶翻找搜索結果的東西都會損害谷歌的可以促使人們點擊廣告的事務性業務模式。數據顯示,2021年,Alphabet公司2576億美元的收入中約81%來自廣告,這其中大部分是谷歌的按點擊付費廣告。
“這的確是一種更好的體驗,”他補充說,“谷歌搜索的目標是讓你點擊鏈接,最好是點廣告,頁面上的所有其他文本都只是用來湊數的東西。”2019年,拉馬斯瓦米與他人聯合創建了名為Neeva的訂閱式搜索引擎,并準備在未來幾個月內推出該引擎自己的生成式搜索功能,可以對網頁進行歸納總結并添加腳注。
ChatGPT不顯示其信息來源。事實上,它的創造者們很可能不知道它是如何生成答案的。這揭示了它的最大弱點之一:有時候,它給出的答案是完全錯誤的。
去年12月5日,面向程序員的問答網站Stack Overflow暫時關閉了平臺用戶分享ChatGPT建議的功能,稱程序員利用該系統上傳的數千條答案經常是錯誤的。
有消費者發現,當我把12歲女兒的英語作文題輸入系統時,它給出了一篇冗長、雄辯的分析,聽起來言之鑿鑿。但答案中錯誤連連,比如它稱一位文人的父母早已過世,而實際上他們還活著。
關于這個缺陷,最令人不安的是不準確的地方難以察覺,尤其是當ChatGPT聽上去信心十足的時候。Stack Overflow網站稱,該系統給出的答案“通常看上去很完美”。OpenAI自己也承認,這些建議往往貌似可信。開始的時候,OpenAI是想把它的系統訓練得更為謹慎,但結果卻是,它拒絕回答它知道答案的問題。它反其道而行,給出的答案就像是某位不學無術的大學兄弟會成員用來蒙混過關的論文。胡言亂語還流利順暢。
目前還不清楚ChatGPT的錯誤有多大的普遍性。推特上流傳的一項估計是2%到5%。或許更多。這將使互聯網用戶對利用ChatGPT獲取重要信息持慎重態度。谷歌還有一個優勢:它主要通過對產品的事務性搜索查詢和對其他網站的導航式搜索(比如有人會鍵入“Facebook”或“YouTube”)來賺取收入。谷歌2022年的前100名搜索查詢中,這類查詢占據了多數。只要ChatGPT不提供其他網站的鏈接,就不會太深入地侵占谷歌的地盤。
但這兩個問題會隨時間推移而演變。隨著OpenAI將其模型的訓練內容擴展到更接近當前的時間段,ChatGPT的準確度可能提高。為此,OpenAI正在開發一個名為WebGPT的系統,希望能針對搜索查詢提供更準確的答案,其中也將包括對信息來源的引用。ChatGPT和WebGPT的搭配使用,可能是對谷歌的有效替代方案。ChatGPT答案的準確性已經高于OpenAI早期的系統了。
據報道,ChatGPT五天內就聚集了100萬用戶。這是非凡的成就:Instagram用兩個半月才達到這個數字,Facebook用了10個月。對于其未來應用,OpenAI并沒有公開給出推測,但如果它的新聊天機器人開始分享其他網站的鏈接,尤其是那些售賣商品的網站鏈接,就可能給谷歌帶來真正的危險。