用上大模型的「直答」,能讓知乎答案更靠譜嗎?
如果說 2023 年,AI 大模型給所有人都帶來了一種前所未有的震撼,那么到了 2024 年,這種震撼毫無意外地有所削弱,AI 大模型競爭的核心焦點已經(jīng)轉(zhuǎn)移到了落地的應用上:
得讓更多人真正地用起來。
在前幾天舉辦的 2024 知乎第十屆鹽 Club 新知青年大會上,知乎正式發(fā)布了一款新的 AI 大模型產(chǎn)品「知乎直答」,底層基于知乎自主訓練的「知海圖 AI」大模型。
不過嚴格來說,「知乎直答」并不新。
早在今年 3 月舉辦的 2024 知乎發(fā)現(xiàn)大會上,知乎其實就發(fā)布了 AI 功能「發(fā)現(xiàn)·AI 搜索」。在官方表述中,「發(fā)現(xiàn)·AI 搜索」是以社區(qū)可信賴內(nèi)容為來源,給用戶帶來集新搜索、實時問答和追問功能于一體的全新體驗。
這個表述基本可以套用在「知乎直答」上,區(qū)別在于從「以社區(qū)可信賴內(nèi)容為來源」轉(zhuǎn)變到了「以知乎社區(qū)的優(yōu)質(zhì)內(nèi)容為核心,多種數(shù)據(jù)源為輔助」,還從依附知乎的一個功能正式升級為一個擁有獨立域名(zhida.ai)的獨立產(chǎn)品。
但對于普通用戶,更關心的問題可能還是:作為一款 AI 大模型產(chǎn)品,「知乎直答」真的可以如官方所言,「為大家提供一種全新的獲取可靠信息的途徑」嗎?以及比起其他類似的 AI 搜索產(chǎn)品,以知乎社區(qū)內(nèi)容為核心的「知乎直答」又有什么優(yōu)勢?
一切都要「實踐出真知」。
“AI 搜索”只是皮囊,知乎內(nèi)容才是靈魂
「知乎直答」的產(chǎn)品設計非常簡單,也非常熟悉,一言以蔽之就是——類 Perplexity 的 AI 搜索設計。國內(nèi)外很多 AI 搜索產(chǎn)品也都采用了這一設計,原因倒也不復雜:好用,也夠用。
圖/雷科技
進入主頁,正中間是最核心的提問框,下方是問題推薦欄,作為初上手用戶的一種引導以及提高用戶粘性的一種策略,側(cè)欄則是問答列表和用戶設置。
輸入問題后,「知乎直答」同樣也是經(jīng)過「理解問題」「查找信息」,才能「生成回答」「完成回答」。完成回答后,除了能看到最終呈現(xiàn)的回答內(nèi)容,你還可以看到前置的「參考來源」。
圖/雷科技
與此同時,你還可以繼續(xù)「深入」,追問 AI 一些問題,比如在 iPhone 16 計劃引入不銹鋼電池外殼這個問題下,小雷繼續(xù)追問「其他廠商會用嗎?」AI 可以聯(lián)系上下文進行理解,不需要重復提及「不銹鋼電池外殼」。
圖/雷科技
此外除了默認的「深入」模式,用戶還能選擇「簡略」模式進行提問,顧名思義就是每次輸出更少字數(shù)的回答。
而這些,也就基本構成了「知乎直答」的「皮囊」。坦白講,談不上什么驚喜,但也算得上現(xiàn)階段比較成熟的設計,只是有些細節(jié)需要打磨,比如在追問中選擇回答模式時,選項窗口的彈出位置等。
不過正所謂,「好看的皮囊千篇一律,有趣的靈魂萬里挑一!
「知乎直答」最核心的競爭力都來自知乎的海量回答,這既是中文互聯(lián)網(wǎng)最高質(zhì)量、最重要的語料庫之一,也是一個實時更新、匯集無數(shù)用戶問答的數(shù)據(jù)庫。
簡而言之,在預訓練大模型的階段,「知海圖 AI」大模型就將高質(zhì)量的知乎問答作為核心語料進行訓練;而在「知乎直答」的落地應用上,也將知乎作為核心數(shù)據(jù)庫用來「查找信息」,最終基于此「生成回答」。
但說歸說,最終還是要見真招的。
用上AI大模型,知乎答案會更靠譜嗎?
眾所周知,AI 大模型最強大的能力之一是對自然語言的理解,AI 搜索對比傳統(tǒng)搜索最大的一個優(yōu)勢也是能夠更準確地理解用戶意圖。
從「理解問題」的角度,「知乎直答」確實在一定程度上體現(xiàn)出了 AI 大模型的優(yōu)勢。比如詢問「你和秘塔 AI 搜索之間有什么區(qū)別」,能夠理解我是在問「知乎直答」和「秘塔 AI 搜索」之間的區(qū)別,并從功能定位、技術特點、用戶交互等角度進行對比。
圖/雷科技
就是祭出中文十級考題,讓「知乎直答」理解下「人要是行,干一行行一行,一行行行行行,行行行干哪行都行。要是不行,干一行不行一行,一行不行行行不行,行行不行干哪行都不行」,也能準確理解語義。
圖/雷科技
此外,「知乎直答」也能根據(jù)語境進行理解,還了解一些垂直領域的專用名詞,比如詢問「詹姆斯是 NBA 的 GOAT 嗎」,能明白是指勒布朗·詹姆斯(LeBron James),也明白 GOAT 在此處代表 NBA 歷史上最偉大的球員。
圖/雷科技
不過「知乎直答」在時間判斷上似乎存在一些問題。比如詢問五年前能準確推導到 2019 年,問十年前卻直接推導到了 2012 年(應該是 2014 年)。
圖/雷科技
另外從參考來源來看,「知乎直答」的邏輯也可能存在問題,在「查找信息」過程中更多是以「十年前」,而非「2012 年」或者「2014 年」為關鍵詞進行查找。
這也引出了「知乎直答」在理解問題后的下一步:查找信息。
相比其他 AI 大模型產(chǎn)品,AI 搜索在技術上最核心的區(qū)別是基于 RAG (檢索增強生成)技術和實時聯(lián)網(wǎng)生成回答,除了檢索能力,另一個影響大模型生成質(zhì)量的關鍵因素是數(shù)據(jù)庫。
而相比其他 AI 搜索,知乎恰恰擁有一個得天獨厚的優(yōu)勢——可能是中文世界最優(yōu)質(zhì)的站內(nèi)內(nèi)容,同時在從「發(fā)現(xiàn)·AI 搜索」功能升級到「知乎直答」產(chǎn)品的過程中,知乎沒有局限于站內(nèi)內(nèi)容,而是擴大到了全網(wǎng)的可檢索內(nèi)容。
比如在「C919 國產(chǎn)大飛機目前處于什么水準」的問題中,「知乎直答」除了找到站內(nèi)的一些回答,還查閱到了不少來自媒體報道的內(nèi)容,包括百度百科、澎湃新聞、政府網(wǎng)站、新華社等網(wǎng)站來源。
圖/雷科技
不過當我們使用「知乎直答」的時候,首先會有一個很多人關心的問題:「知乎直答」真的能用上知乎的回答嗎?
最簡單的回答是:用上了,而且真的做到了可追溯。
以蘋果計劃引入不銹鋼電池外殼的問題為例,「知乎直答」第一個回答的質(zhì)量倒并未讓小雷很驚喜,包括電池能量密度的普遍提高,以及歐盟政策的影響都沒有被提及。
但「知乎直答」還是從七個方面回答了蘋果引入不銹鋼外殼電池的理由,同時在一些地方直接標示了引用來源,絕大部分都是來自知乎站內(nèi)的回答,只有 13、15 兩個來源是站外媒體報道。
圖/雷科技
點擊這些引用鏈接,也確實能夠看到相對應的信息和觀點來源。不過需要注意的是,引用也只是部分引用,比如在「維修友好」的部分,引用來源只提到了前半句的「不銹鋼電池外殼的設計可能便于維修」。
至于后半句關于「iOS 維修模式」的內(nèi)容,實際在引用鏈接中只字未提,更多還是大模型的「創(chuàng)作」。
另外,「知乎直答」雖然號稱可以利用站內(nèi)的海量優(yōu)質(zhì)內(nèi)容,但實際不同問題下可以利用的站內(nèi)內(nèi)容質(zhì)量參差不齊,有些問答本身的質(zhì)量就比較低,甚至回答干脆就是由 AI 生成的。
這可能也是知乎選擇將檢索范圍從站內(nèi)擴大全網(wǎng)的主要原因之一。
但無論如何,「知乎直答」最終都是要「生成回答」的。在這一點上,得益于站內(nèi)的優(yōu)質(zhì)內(nèi)容,「知乎直答」確實在一些領域中表現(xiàn)得比較專業(yè),回答的內(nèi)容更加切實,而不是空洞。
以 C919 的問題為例,「秘塔 AI 搜索」的回答比較離題,結論也很寬泛。
秘塔 AI 搜索的回答,圖/雷科技
同樣的問題在「知乎直答」這邊則有更高質(zhì)量的回答,相關的信息和觀點都稱得上言之有物,能夠幫助用戶更好地理解 C919 的定位、競爭力以及意義。
知乎直答的回答,圖/雷科技
此外在「五年前大家對 5G 都是什么看法」的問題中,「知乎直答」在開頭就回答道,「五年前,即 2019 年,人們對 5G 的看法是多元化的,既充滿了期待也伴隨著一些質(zhì)疑!怪笳归_的觀點,也確實反映了當時中文互聯(lián)網(wǎng)上對于 5G 的不同觀點。
圖/雷科技
不過一些問題上,小雷也發(fā)現(xiàn)了「知乎直答」的一些不足。
比如詢問「姚明加入 NBA 的時候,NBA 亞軍隊的教練是誰」,可以看到「知乎直答」知道了姚明加入 NBA 是在 2002 年,但表示「沒有直接信息表明姚明加入 NBA 那一年的亞軍隊教練是誰」。
但如果繼續(xù)追問「所以 2002 年 NBA 亞軍隊的教練是誰」,「知乎直答」可以給出正確的推導過程和答案——新澤西網(wǎng)隊(現(xiàn)布魯克林籃網(wǎng)隊)時任主教練拜倫·斯科特(Byron Scott)。
圖/雷科技
換言之,「知乎直答」完全是有能力直接給出正確答案的,但不知道受限于什么因素,需要用戶繼續(xù)追問才能給出最終回答。
還有在不銹鋼電池外殼問題的追問中,隨著追問輪次的增加也會影響「知乎直答」的上下文理解能力,比如在第五輪的追問,直接詢問「換用不銹鋼外殼會有哪些變化」,AI 似乎忘掉了之前都是以手機電池為核心。
圖/雷科技
而在第六輪的追問中,小雷重新提到了「手機電池」,AI 倒是也能重回正軌,基于手機電池進行回答。
簡單來說,「知乎直答」在剛開始能夠較輕松地結合上下文理解新的問題,但隨著上下文長度的拉長,這種理解能力可能會有明顯地下降。
寫在最后
總的來說,在一眾 AI 大模型產(chǎn)品之中,「知乎直答」確實找到了一些差異化的定位,基于站內(nèi)的優(yōu)質(zhì)內(nèi)容,提供更高信息量、更能追溯來源的回答。
不過問題也還存在,有些可以通過一些技巧解決,比如最好明確時間而非使用「X 年前」作為輸入詞,多輪問答可以適當強調(diào)下關鍵詞等;有些還是需要基礎大模型以及技術上改進,比如模型對用戶意圖更深層的理解,參考來源的權重排序或者篩選等。
就現(xiàn)在來說,如果我知道一些領域和話題已經(jīng)在知乎有了精彩的討論,確實會更愿意使用「知乎直答」快速、便捷地進行了解和深入。
但會不會更大程度地使用「知乎直答」作為日常獲取信息和觀點的渠道呢?還是要看后續(xù)模型和產(chǎn)品的改進,我相信還是很有希望的,就像知乎直答官方號在一個關于「知乎直答」的問題中答到:
AI 時代才剛剛開始,前面的路還很長。
來源:雷科技
原文標題 : 用上大模型的「直答」,能讓知乎答案更靠譜嗎?
最新活動更多
-
10月31日立即下載>> 【限時免費下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報名>>> 【在線會議】多物理場仿真助跑新能源汽車
-
11月28日立即報名>>> 2024工程師系列—工業(yè)電子技術在線會議
-
12月19日立即報名>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
即日-12.26火熱報名中>> OFweek2024中國智造CIO在線峰會
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市