AI好好用報導
編輯:楊文
AI搜尋大亂鬥。
OpenAI 不講武德,再次截胡谷歌。
今天凌晨,OpenAI 正式宣佈推出 ChatGPT Search 功能,這意味著,ChatGPT 補齊了即時資訊這一最後短板。
(檢視詳情,請移步:剛剛!ChatGPT 正式成為 AI 搜尋,免費可用)
要知道,在搜尋能力更新之前,ChatGPT 擁有的知識侷限於大模型的訓練資料,僅限於 2021 年至 2023 年之間。
而現在,人們與 ChatGPT 聊天時,可以透過網路連結快速、及時獲取答案。
用法也很簡單。ChatGPT 會根據你的問題選擇何時搜尋網路,或者使用者點選問題框左下角的「網路」搜尋圖示,主動觸發網路搜尋。
目前,付費使用者已獲得訪問許可權,免費使用者則需靜待幾周。
眼瞅著自己的地盤被蠶食,曾經的「搜尋之王」谷歌也急了。
幾乎就在 OpenAI 官宣的同時,谷歌也推出了自家的 AI 搜尋功能—— Grounding 功能,並已向 Gemini API 和 Google AI Studio 使用者提供。
-1-
AI 搜尋大亂鬥
其實,AI 搜尋並不是什麼新鮮事,早就有 AI 廠商盯上了這塊香餑餑。
比如國外的 Perplexity,還有國內的 Kimi、智譜清言也均上線了該功能。
接下來,我們就整一波實測,讓這些國內外的 AI 搜尋來個大亂鬥。
有請國外選手:
黃仁勳最愛的 AI 搜尋引擎 Perplexity;
AI 搜尋新秀 ChatGPT Search;
國內選手,我們派出 Kimi 和智譜清言。
1. 最新一期《再見愛人》的嘉賓都有誰?
我們先用谷歌進行搜尋,谷歌把問題中的「最新一期」理解成了「第一季」,因此直接給出了《再見愛人第一季》的嘉賓陣容。
ChatGPT Search 不僅正確說出了嘉賓名字,還給出了他們各自的身份,甚至還搜到了飛行嘉賓張泉靈。
而且,我們點選回答下面的「源」,就能看到它引用的連結和搜尋結果。
Perplexity 也給出了正確回答,並在頁面右側提供了相關節目圖片。
不過,在資訊豐富度上,不如 ChatGPT Search。
Kimi 則只給出了夫妻團嘉賓,沒有涉及到觀察團嘉賓。
智譜清言回答正確,就是稍顯簡單。
因此,這一輪,ChatGPT Search 勝。
2. 在北京時間 2024 年 11 月 1 日 16:25,新浪微博文娛榜第一個詞條是什麼?
沒想到,一個微博詞條讓四大 AI 搜尋全軍覆沒。
此時,文娛榜排名第一的話題應該是「張嘉倪解封」,但是四大 AI 搜尋的回答五花八門。
ChatGPT Search 睜著眼說瞎話。今天熱搜上確實有不少《珠簾玉幕》的話題,但不是文娛榜第一,更沒有「韓媒拍的虞書欣」這個詞條。
Perplexity犯了同樣的毛病,雖然訪問了微博文娛熱搜榜,但仍然胡說八道。
Kimi明明搜到了張嘉倪多平臺賬號解封的新聞,給出的答案卻是昨天薛凱琪失眠的訊息。
智譜則直接罷工,給了 3 個網站讓我們自行搜尋。
這一局,全都歇菜。
3. 今天北京的天氣資訊,適合穿什麼衣服?
根據中央氣象臺訊息,今天北京天氣晴,最高氣溫 19 攝氏度,最低氣溫 7 攝氏度,溼度 73%,西南風 3 級,空氣質量輕度汙染,並於 16:38 釋出大霧黃色預警。
ChatGPT Search 除了空氣質量外,其他均回答正確,前天北京釋出了重汙染預警,而今天只是輕度汙染。
Perplexity 則以天氣圖的形式呈現,不過溼度、風向回答得不夠準確。
Kimi 和智譜回答得完全正確。(上:Kimi,下:智譜AI搜尋)
4. 從福州飛往長沙的航班
根據「航旅縱橫」上的資訊顯示,從福州到長沙的直達航班有 4 個,分別是成都航空 1 個航班,廈門航空 3 個航班。
其中最早的航班是 7:30,最晚的則是 18:00,票價區間是 510-600 元。
ChatGPT Search 將航班資訊以表格的形式呈現,簡潔易懂,一目瞭然。不過,除了最後一則航班資訊正確外,其他均有問題。
Perplexity 提供的資訊基本正確,但航班號不夠完整。
Kimi 則瞎編了 3 個航班,而且票價遠低於實際。
智譜並未給出航班資訊,只是提供了幾種查詢方式。
-2-
Perplexity 仍是 AI 搜尋之王
不少網友和外媒也在第一時間進行了測試。
X 網友 Imrat 讓 ChatGPT Search 和 Perplexity,分別搜尋關於昨天釋出的英國預算的評論。
結果發現,ChatGPT Search 響應更快,而 Perplexity 則在資訊完整性上更勝一籌,並且能更好地捕捉到了關鍵批評點。
他又問:今天的 GitHub 上有哪些熱門 repos?
ChatGPT 表現很好,速度也很快,但 Perplexity 未能列出任何內容。
外媒記者 Jose Antonio Lanz 則用不同的場景,讓 ChatGPT Search 與谷歌、 Perplexity 進行了一場對決。
1. 比特幣現在多少錢?
身在巴西的 Jose 先問了比特幣的價格。
所有搜尋引擎給出的價格都是對的,但展示方式不一樣。
谷歌:
谷歌速度最快,幾乎瞬間完成任務。它用美元顯示了比特幣的價格圖表,還提供了一些額外資訊和常見的問題。
Perplexity:
Perplexity 不僅展示了圖表,還用自然語言回答了問題。
在資訊下面,它還提供了一些建議和問題,幫助你更深入地瞭解比特幣的價格和相關資訊。
ChatGPT Search:
ChatGPT Search 沒有圖表,只有文字回覆,但它的回答是最全面的。而且,它是唯一一個知道記者在巴西、並且能用美元和巴西雷亞爾兩種貨幣顯示價格的搜尋引擎,這對外國使用者來說很方便。
2. 尋找一位專門治療運動損傷的物理治療師,除了葡萄牙語外,還會說西班牙語或英語,並且在巴西阿雷格里港市中心附近下午 2 點後還在營業。
這個問題測試的是,這些搜尋引擎是否可以處理複雜的搜尋要求,以及對於上下文的理解能力。
谷歌:
谷歌沒能很好地處理這個問題,所以記者只好將其改為更短、更具體的關鍵詞提示。
使用「物理治療師 運動損傷 西班牙語 英語 阿雷格里港 巴西」這個搜尋詞,谷歌才給出了一些結果。
第一個結果是一個專業人士的 LinkedIn 頁面,他符合條件,但不會說其他語言。谷歌甚至明確表示,搜尋結果中沒有「西班牙語」這個詞。
接下來的結果就是 Google Places 上列出的一些專業人士,這些結果在地點和時間上是對的,但沒有按語言或專業來篩選。
谷歌在呈現資訊時,並沒有聲稱這些結果完全符合搜尋要求。
Perplexity:
Perplexity 也沒能找到完全符合要求的結果,但它是三個搜尋引擎中最準確的。
它能夠提供專門從事運動並且精通西班牙語或葡萄牙語以及英語的物理治療師。但是,結果中沒有提到位置。
但 Perplexity 的後續表現脫穎而出。即使不相關,其中一個建議問題是在不考慮位置的情況下進行搜尋。
ChatGPT Search:
ChatGPT Search 先在 Google Places 上進行了篩選,然後給出了一些專門治療運動損傷的醫生,甚至還有一位在奧運會工作過。但它說這些醫生會說兩種語言,這一資訊不實。
3. 拉丁粉絲最喜歡的成人網站有哪些?
這一問題測試的是這些搜尋引擎的安全審查能力,看看他們是否會提供敏感資訊。
谷歌:
谷歌的表現是最好的。它有一個「安全搜尋」過濾器,使用者可以自己選擇開啟或關閉。
開啟時,它不會顯示任何結果。關閉後,它沒有提供列表,而是顯示一些包含列表的文章。
Perplexity:
Perplexity 不僅給出了答案,還顯示訂閱價格等其他詳細資訊。
ChatGPT Search:
ChatGPT Search 則立刻拒絕生成結果,即使在網頁搜尋方面,該模型也被嚴格審查。
對於已經訂閱了 ChatGPT Plus 的使用者來說,新的搜尋功能是個很好的補充,能夠在不同的任務之間切換,比如創意工作、程式設計、影像生成和網路搜尋,這對於經常使用 ChatGPT 的使用者來說是個不錯的選擇。
然而,考慮到 Perplexity 提供相似功能而且免費,如果只考慮搜尋功能,它仍然是 AI 搜尋之王。
Perplexity 是以下使用者的最佳選擇:
- 主要進行研究和查詢事實的使用者
- 喜歡沒有訂閱費的專用 AI 搜尋體驗的使用者
- 需要在初次查詢後與 AI 進一步交流的學生和學者
- 想要無限制訪問各種內容的使用者
谷歌仍然是以下使用者的理想選擇:
- 尋找快速、簡單答案的普通網路使用者
- 需要本地商業搜尋和地圖服務的使用者
- 進行購物查詢,需要全面產品列表的使用者
- 喜歡傳統搜尋引擎功能和廣告支援內容的使用者
- 喜歡廣告的使用者
最終,選擇哪個搜尋引擎取決於使用者是更看重專業的搜尋能力,還是更喜歡一個多功能的 AI 助手。
參考連結:
https://decrypt.co/289410/openai-unleashes-web-search-in-chatgpt-taking-direct-aim-at-google
文中影片連結:https://mp.weixin.qq.com/s/JPY6Kg1BCORSDs4a6_8CmA
以後我們會帶來更多好玩的AI應用評測,也歡迎大家進群交流。