訂閱
糾錯
加入自媒體

大模型To C落地,AI商業(yè)化半場開香檳?

文:互聯(lián)網(wǎng)江湖

大模型似乎沒能帶來更多的估值上的想象力。

今年3月14日,OpenAI發(fā)布GPT-4,大模型理解能力、可靠性有了進一步提升。兩天后,百度聞心一言正式發(fā)布,直到8月底,文一言才正式向大眾開放服務。

百度之外,科大訊飛5月6日發(fā)布星火大模型,9月5日,面向全民開放。商湯方面。4月份,發(fā)布日日新大模型體系,8月底,日日新大模型獲批。騰訊渾元、阿里通以千問,也紛紛跑步入場。

如今,首個國產(chǎn)大模型亮相半年過去了,各家資本市場表現(xiàn)如何?

百度3月14日港收盤股價129港元,9月18日收盤132.2港元。

商湯4月11日收盤3.33港元,9月18日收盤股價1.46港元。

科大訊飛5月8日收盤63.76元,9月18日收盤48.38元。

……

對于大模型概念,確實喧囂過,但是目前來看,繁華褪盡,市場似乎并不買賬。

8月15日,《生成式人工智能服務管理辦法(征求意見稿)》開始施行,AIGC產(chǎn)品合規(guī)之路明朗,于是,國產(chǎn)大模型密集發(fā)布,百度、訊飛、商湯等一眾大模型玩家開始搶奪ToC市場。

那么人們手機中的“第一個大模型應用”能不能成為AI生成的“第一入口”?值得深究。

大模型“內(nèi)卷”到前臺,AI落地半場開香檳?

可以確定的一點是,走到前臺,市場期待的是應用意義上的“產(chǎn)品化”。大模型能夠解決什么樣的客觀問題,能解決問題的應用,才是有商業(yè)價值的應用。

大模型最直接的應用,是語音助手。

大模型強化一波語音交互應用,可能會給某些硬件行業(yè)帶來“第二春”,比如智能音箱有了新賣點,小度智能音箱可能會找到新的增長點。

語音助手領域的應用,最順利的可能還是汽車。

文心一言收獲了吉利、長城、紅旗、東風日產(chǎn)、嵐圖,ChatGPT接入奔馳,星火大模型接入廣汽,華為盤古接入賽力斯……這也是大模型最容易商業(yè)化的場景之一。畢竟,對于車載場景來說,語音助手應用是剛需,也是比較成熟的B端落地領域。

大模型向C端滲透過程中,雖然已經(jīng)邁出重要的一步,但距離真正的大規(guī)模應用,恐怕還有距離。

如今的歡呼,倒像是半場開香檳,現(xiàn)實是大模型還遠未到成熟的階段。

人們需要接受的是,大模型看起來很強,但你真正用它去解決問題的時候,會發(fā)現(xiàn)真正沒有那么的強。

對于一些最實際的,哪怕是簡單的需求,大模型都還沒有辦法滿足,背后有數(shù)據(jù)的問題,生態(tài)的問題,但歸根到底,還是只能有限地解決實際需求。

首先是數(shù)據(jù)新鮮度的問題。在實際的使用過程中,我們發(fā)現(xiàn),同樣的問題,大模型給出的答案甚至不如搜索。

這是百度搜索給出的答案:

這是文心一言給出的答案:

從時效性以及準確度來說,反而是搜索更符合常理,也更符合人們對于真實場景的認知。

“凡是要跟語言文字或程序代碼打交道的應用場景,都可能有文心一言的用武之地。”王海峰曾對外界表示。

的確,大模型的應用場景很大,但現(xiàn)實是,真實的需求場景中,當下的大模型產(chǎn)品似乎還有不少能夠提升的空間。

相比文心一言,訊飛星火大模型給出了答案,但時間是2022年度上市公司排名,并不是當下最新的數(shù)據(jù),也同樣是數(shù)據(jù)新鮮度的問題。

數(shù)據(jù)新鮮度的問題,本質(zhì)上是數(shù)據(jù)生態(tài)的孤島問題。

對于某些垂直領域的提問,大模型給出的答案無論是從專業(yè)度上還是從時效性上都似乎不能滿足人們的需要。這可能是因為,無論是文一言,或是星火大模型,大家對垂直領域的數(shù)據(jù)訓練其實還不夠。

比如,對于財經(jīng)信息方面,大模型給出結果可能還不如財經(jīng)信息網(wǎng)站上搜到的結果準確,可用,當然這里面可能會涉及版權的問題,但本質(zhì)上其實就是數(shù)據(jù)生態(tài)的孤島的問題。

拿ChatGPT來說, OpenAI、Google 及其支持的 Anthropic 多年來一直在使用其他網(wǎng)站或公司的在線內(nèi)容來訓練他們的生成式 AI 模型,雖然數(shù)據(jù)的量有保證了,但也有潛在的法律問題。

當大模型走向前臺,這種數(shù)據(jù)孤島問題會更加突出。因為用戶不在乎你怎么獲取數(shù)據(jù),用戶只在乎,你的工具好不好用。

天眼查APP搜索大模型,相關結果有100多家,雖然其中也有不少大模型都發(fā)布了各自的APP,但目前來看真正好用的其實不多,大量用戶涌入還是因為有新鮮感,大模型在C端應用方面做的工作其實也還很有限。

比如,用戶想把一張2K分辨率的圖片清晰度生成為4K,其實技術上并不復雜,但大模型卻給不出結果,對于普通用戶來說。用過一次不好用,恐怕就很難再堅持用下去了。

就像曾經(jīng)的智能音箱、語音助手, 其實大家手機里都有AI語音助手,為什么使用的頻率并不高?其實還是因為不好用。所以,對于百度、訊飛甚至商湯來說,挑戰(zhàn)不在于能不能把C端的應用做出來,而在于做的夠不夠好。

百度產(chǎn)品上比較成功的就是百度搜索,智能搜索的確很強大,但大模型產(chǎn)品能不能做到像搜索一樣的水平,需要打一個問號。

對訊飛而言,一些硬件產(chǎn)品做得不錯,但考驗在于軟件產(chǎn)品的定義能力;對于商湯來說,ToB的應用做了不少,但ToC顯然還是需要更多的經(jīng)驗。

目前來看,國產(chǎn)ToC的大模型差異化并不大,大多是內(nèi)容創(chuàng)作、AI繪畫、翻譯、AI辦公等場景應用,也能幫助人解決一些實際的問題,比如生成會議大綱,給PPT寫提綱、寫研報、寫工作日報。

但接下來,能不能ToC的大模型真正做成“爆款”,做出差異化,恐怕考驗的就不僅是AI技術了。

大模型產(chǎn)品化的窗口期不多了

大模型落地B端的一個最大阻礙是不能理解業(yè)務。

舉個例子,金融領域是強數(shù)據(jù)導向的領域,人們需要在數(shù)據(jù)的基礎上去做決策,如果把大量的數(shù)據(jù)以及金融理論用來訓練AI,那么面對瞬息萬變的市場,大模型的決策有多少的準確度?用戶敢不敢用?

之前馬斯克曾表示,F(xiàn)SD V12幾乎完全是神經(jīng)網(wǎng)絡,構筑了一套端到端自動駕駛技術。也就是說,端到端的信息輸入輸出過程是一個“黑箱”。

你不知道AI是怎么具體做決策的,但是你最終會得到一個可用的結果。

大多數(shù)時候,這樣的應用是沒有問題的,比如出行領域,人們需要的是安全到達目的地,即便是決策黑箱的問題存在,但并不影響實際應用。

決策黑箱最大的問題是決策信任的問題,云到端的大模型也有類似的問題。

比如,你問大模型一個問題,AI問題給出的答案夠不夠真實可信?這個問題還需要花大力氣解決。簡單點說,要去教大模型什么樣的結果是正確的,是易用的,這就需要不斷把模型的輸出結果跟現(xiàn)實去“對齊”。

這也是大模型落地C端的一個重要挑戰(zhàn)。

輸出結果的真實性,有效性能不能得到最基本的保證?這是大模型應用能否真正迎來大爆發(fā)需要解決的前置問題。

過去ChatGPT花了大量的成本去做這個件事,文心一言,星火大模以及商湯的日日新大模型顯然也需要經(jīng)歷這個過程。

目前階段,通用大模型的應用熱更像是人們的一場自嗨,公司發(fā)布大模型往往會伴隨著一系列的公關活動,但除此之外,能給B端公司帶來怎樣的效益增量,仍然沒有一個較為清晰的方案,只是空有一句“AI智能化大模型降本提效”的公關話術。

這種品宣做“巨人”業(yè)務上做“矮子”的現(xiàn)狀,無非是想打上大模型的標簽,好讓二級市場高看自己一眼。不過,市場已經(jīng)在用腳投票,最終還是會看實際的商業(yè)化表現(xiàn)。

互聯(lián)網(wǎng)江湖認為,如果說過去大模型的價值,在于對科技企業(yè)的“標簽化”想要在二級市場謀個好價格,那么接下來能不能活下去,就在于能否完成“產(chǎn)品化”,真正靠應用能力“打天下”。

硅谷教父彼得·蒂爾曾說,喜歡給自己貼標簽賽道標簽的公司幾乎都是不可投資的那一檔,他曾經(jīng)這樣表達這個觀點:“我對一切主題熱點投資都抱有懷疑態(tài)度,一般來說這樣的投資毫無區(qū)分度。大家很喜歡把一大堆完全不同的東西放進一個熱點中,標簽是,云計算,大數(shù)據(jù),人工智能,醫(yī)療SaaS等等,但是實際上是底層卻完全沒有區(qū)分度的公司。”

大模型也是如此。

事實上,AI賽道的泡沫被擠出之后,市場清楚地知道,大模型真正的價值還是在于產(chǎn)品化。而產(chǎn)品化的關鍵,不僅是技術的比拼,也是產(chǎn)品經(jīng)理能力的比拼。

在這一點上,上個時代的“王者”們(比如阿里、騰訊)可能比百度們更有經(jīng)驗和話語權。

一方面,產(chǎn)品化的關鍵在于能夠精準定義用戶需求。

比如,大家目前都比較青睞于去做AI原生應用,但AI原生應用如何能夠更好地去滿足用戶的實際需求,靠的還是產(chǎn)品定義。

另一方面,產(chǎn)品化之后,大模型才有差異化,而商業(yè)化其實是產(chǎn)品化自然而然的結果。

在體驗過各家發(fā)布的大模型產(chǎn)品后,有這么一種強烈的感覺,雖然叫不同的名字,但大家的產(chǎn)品并沒有太多差異,能夠完成的任務類型都差不多。

比如,剛開始用文心一言,你會覺得確實很厲害,什么問題都能給出答案,一旦涉及稍微深度點的內(nèi)容,就會發(fā)現(xiàn)他給出的答案太公式化,而且大多數(shù)時候像是空話、套話。

不只是文心一言、訊飛的星火大模型、商湯的商量SenseChat,大家表現(xiàn)其實都差不太多。

本質(zhì)上,這是因為大模型本質(zhì)上不是強人工智能,還是需要靠數(shù)據(jù)去不斷訓練,并不是真正意義上根據(jù)信息去做判斷。所以差異化的關鍵,還是在于最終的應用產(chǎn)品。

互聯(lián)網(wǎng)江湖認為,大模型產(chǎn)品不僅需要靠場景“吸引住”用戶,更需要用體驗來留住用戶,甚至激發(fā)用戶的付費意愿。

目前來看,通過審批的這些大模型應用產(chǎn)品集中了覆蓋用戶日常大部分場景的工具,從工作到文娛各個方向的應用都已經(jīng)開始出現(xiàn),想要成為新的入口。

問題在于,大多數(shù)用戶還是處于嘗鮮的狀態(tài),用來解決實際問題的用戶可能并不多。原因可能還是在產(chǎn)品應用上。

就拿檢查錯別字這個簡單的需求來說,從親身的使用體驗來講,目前市面上的主流的大模型應用做得都不怎么好,反倒是一些專門做文章校對的垂直平臺,用戶體驗要好得多。作為一個文字工作者來說,對于這樣的產(chǎn)品其實有很強的付費意愿。

不僅是文字工作,代碼生成、圖片生成也是如此,目前的大模型初步解決了“能不能用”的問題,但真正的關鍵是要解決“好不好用”的問題。

所以,這些細分應用上的產(chǎn)品能力,可能會是用戶能不能真正把大模型用起來的關鍵。

用戶大量用起來之后,用來訓練AI的數(shù)據(jù)足夠多,AI大模型的能力便能夠突飛猛進。ChatGPT真正的起飛,也是在大量用戶涌入之后。

可以預見的是,大模型開放之后,AI原生應用會出現(xiàn)一波爆發(fā),而在應用爆發(fā)之后,能夠有多少用戶留下來,可能是“文心一言”們需要深入思考的問題。

“想在‘百模大戰(zhàn)’之中笑到最后,還是得看究竟會有多少用戶愿意花真金白銀買單。”行業(yè)觀察人士劉宇表示。

ChatGPT用戶過億后,開始對C端收取訂閱費用,每月20美元,而且針對B端專門推出了企業(yè)版。這說明OpenAI的思路在轉變,從做技術轉變?yōu)樽霎a(chǎn)品。當然,前提是ChatGPT已經(jīng)證明了能夠去解決更多的實際問題。

國產(chǎn)大模型,達到GPT4的水平還需要一年,也就是說,真正留給大模型玩家去定義、完善大模型AI原生應用的窗口期還有一年。接下來,如何去做好這方面的工作,進一步提升大模型的數(shù)據(jù)時效問題,可能才是關鍵。

寫在最后:

喬布斯和iPhone的成功證明,真正出彩的不是永遠都不是技術,而是產(chǎn)品。

如何做好應用產(chǎn)品,可能是大模型玩家們需要更明確的目標?梢灶A見的是,接下來C端應用的確都需要用大模型重做一遍,這對百度、訊飛、商湯來說,無疑是一次機遇。

AI行業(yè)從來不缺等風者,但真正缺的是造風者,接下來到了真刀真槍的戰(zhàn)場,誰能一呼百應打開大模型應用的金礦,我們且行且看。

       原文標題 : 大模型To C落地,AI商業(yè)化半場開香檳?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號