訂閱
糾錯
加入自媒體

中國AI公司可以不走尋常路

大模型落地呼聲越來越大,但是以什么方式落地依然有爭議。國內(nèi)如此,國外亦然。不同的思想對應(yīng)著不同的方法論。

一部分AI企業(yè)忙著更新通用大模型打榜,做一些視頻生成工具之類的熱門產(chǎn)物,巨頭多數(shù)屬于此類。

另一部分則在專注行業(yè)大模型或是平臺,例如國外的Glean和國內(nèi)的第四范式,后者最近還發(fā)布了AI數(shù)字人視頻合成平臺,著眼于讓企業(yè)更方便地用上大模型能力。

此外,還有以服務(wù)大模型發(fā)展為己任的“賣鏟子”型公司,比如從數(shù)據(jù)標(biāo)注工作發(fā)展到AI全流程數(shù)據(jù)服務(wù)和模型搭建的Scale AI——如果轉(zhuǎn)型順利,它也會成為第二類公司。

這不是單純的商業(yè)模式辯論,“所有行業(yè)都值得用AI再做一遍”的共識早已形成,但直到現(xiàn)在,還有很多問題在等待著回答。尤其是背靠中國產(chǎn)業(yè)背景的AI公司們,也許可以送上不同的答案。

AI大模型的方向劃分

很多公司現(xiàn)在都可以說自己是AI行業(yè)的,但形成模式≠有長期價值。

目前大多數(shù)企業(yè)利用AI展業(yè)的方式,一定是通用的語言大模型,使用本行業(yè)的數(shù)據(jù)語料訓(xùn)練一下,就已經(jīng)稱得上差異化應(yīng)用。但這很可能是一種取巧的方法,Zapier(一家基于無代碼模式開展業(yè)務(wù)流程自動化探索的公司,與生成式AI自主工作的智能化特點(diǎn)有較強(qiáng)契合性)聯(lián)合創(chuàng)始人Mike Knoop認(rèn)為,擴(kuò)大語言大模型本質(zhì)上只能推動“記憶”這種智力形式的發(fā)展,和智能是有區(qū)別的。它不能理解企業(yè)的場景和需求,所以也做不到把AI的價值徹底發(fā)揮。

圖片

(圖源:Zapier官網(wǎng))

另外,如果我們能將GPU算力投入增加與語言大模型能力提升的曲線進(jìn)行對比,那么它的收益增量雖然確實(shí)存在,但很有可能是存在邊際收益遞減的。當(dāng)互聯(lián)網(wǎng)上已經(jīng)存在的公開簡易數(shù)據(jù)都被用光了之后,再想依靠做通用語言大模型在AI領(lǐng)域彎道超車,就會變成一種幻想。

這對企業(yè)來說更是不利的。企業(yè)總是會在追求新技術(shù)的過程中如“猴子掰玉米”,譬如一開始想要用新技術(shù)解決一個確切的問題,結(jié)果變成了一場概念追逐戰(zhàn):大數(shù)據(jù)出來了就用大數(shù)據(jù),計(jì)算機(jī)視覺火了開始研究CV,到了大模型和生成式AI的時代,AIGC、AGI變成了他們戰(zhàn)略報告的關(guān)鍵詞。但越往后,最根本的問題反而被忘記了。

解決這個問題,或者說解決企業(yè)AI大模型需求問題的方法,其實(shí)就握在AI企業(yè)手中。

明星風(fēng)投公司Benchmark的合伙人Sarah Tavel認(rèn)為,第一波AI用例只是給出了一種API的使用方式,但把人工智能技術(shù)限定在幫助單一工具層面并不是合理的結(jié)果,最好的發(fā)展方向是基于給客戶提供完整的產(chǎn)品和服務(wù)——面向行業(yè)客戶具體需求開展大模型創(chuàng)業(yè)。

而號稱華裔天才少年的Alex Wang,同時也是Scale AI(Scale AI最初以數(shù)據(jù)標(biāo)注服務(wù)起家,后來在此基礎(chǔ)上轉(zhuǎn)變?yōu)橐訟I為主導(dǎo)的全流程數(shù)據(jù)解決方案服務(wù)商,包括幫助客戶建立可用大模型,以及托管服務(wù))的聯(lián)創(chuàng),他認(rèn)為,數(shù)據(jù)才是AI模型性能的瓶頸,而非算法或計(jì)算。數(shù)據(jù)最終來自很多個垂直行業(yè),這意味著AI企業(yè)應(yīng)當(dāng)深入到行業(yè)領(lǐng)域,做符合企業(yè)需求的行業(yè)大模型。

這個過程有兩個需要注意的關(guān)鍵點(diǎn):

一方面是數(shù)據(jù)問題,正如Alex Wang的觀點(diǎn),AI公司要有“讀懂”用戶和行業(yè)的能力。因?yàn)閺母旧蟻碚f,經(jīng)歷過數(shù)字化時代的公司大多有很多數(shù)據(jù)語料躺在倉庫里,但缺乏輔助情況下,它們無法發(fā)揮作用。

另一方面是管理和迭代問題,由于行業(yè)、場景千變?nèi)f化,目前的行業(yè)資源不太可能支持一家公司橫跨所有領(lǐng)域一個一個建造大模型。如何解決這個問題呢?

第四范式和Zapier聯(lián)合創(chuàng)始人Mike Knoop都將關(guān)鍵指向了自動化。技術(shù)方面,AutoML、程序合成和神經(jīng)架構(gòu)搜索都涉及自動化和優(yōu)化過程,以期減少人工干預(yù),提高效率和效果。Mike Knoop認(rèn)為AGI的探索需要基于程序合成和神經(jīng)架構(gòu)搜索,而第四范式創(chuàng)始人兼CEO戴文淵則在接受“智能涌現(xiàn)”采訪時提到,構(gòu)建無數(shù)個行業(yè)大模型的底座技術(shù)是AutoML——自動機(jī)器學(xué)習(xí)。

圖片

(圖源:Microsoft Learn)

戴文淵說,AutoML是“一個失敗的藝術(shù)”,它能發(fā)揮更大的價值,是因?yàn)榈谒姆妒阶鲞^太多的場景,懂得怎么讓數(shù)據(jù)和模型的發(fā)展,向特定場景的需求貼近。成功的化為成果,失敗的變成養(yǎng)料,基于自動化加速擴(kuò)大迭代。就像Alex Wang說的:“機(jī)器學(xué)習(xí)是一種垃圾輸入、垃圾輸出的框架。”但如果我們有高質(zhì)量的行業(yè)數(shù)據(jù),以及不斷糾錯的能力,最終就會讓行業(yè)大模型成為現(xiàn)實(shí),并實(shí)現(xiàn)可靠的落地。

這個行業(yè)的頂尖思想者們,一定程度上對行業(yè)塑造的邏輯保持了對齊。而像第四范式這種根植于中國復(fù)雜產(chǎn)業(yè)場景的AI公司,所做的延伸還可以更多。

做不同的AI模型,想法、途徑和前景

以O(shè)penAI為代表的、一部分專注通用大模型的企業(yè),發(fā)展趨于橫向,大模型就是一切。在商業(yè)模式上,它們售賣的就單純是大模型的能力。相比之下,第四范式、Glean,甚至Palantir這樣的利用AI技術(shù)幫企業(yè)在某些方面做決策以提升整體工作效果的公司,走的是另一條路。它們的商業(yè)模式也不一樣。

比如Glean,它提供基于AI技術(shù)打造的AI企業(yè)搜索和知識管理平臺,并集成了非常多的第三方應(yīng)用功能,直達(dá)其他的SaaS產(chǎn)品。也就是說,把自己變成了工作流的一部分。同時,Glean也可以幫企業(yè)用企業(yè)數(shù)據(jù)訓(xùn)練專屬AI模型,而訓(xùn)練的基礎(chǔ)是Glean自主打造的“可信知識模型”。這家公司的出發(fā)點(diǎn)是,員工往往很難在復(fù)雜的工作體系中找到有用的信息,而Glean在傳統(tǒng)企業(yè)搜索的基礎(chǔ)上,利用AI模型和工作流全流程跨應(yīng)用服務(wù)能力,建立了新的優(yōu)勢。

對照Glean來看,第四范式對提升企業(yè)核心業(yè)務(wù)的關(guān)注,以及實(shí)現(xiàn)AI大模型介入業(yè)務(wù)的手段,在思想內(nèi)核上是一致的。這是因?yàn)樗鼈兊睦砟罹褪菑男袠I(yè)和企業(yè)需求出發(fā)的,脫離了單純的唯技術(shù)論、唯參數(shù)論、唯語言論。不過,第四范式更深入到行業(yè)核心業(yè)務(wù)問題的預(yù)測管理上。

第四范式在今年上半年發(fā)布了行業(yè)大模型平臺先知AIOS 5.0,它繼承了此前第四范式對數(shù)據(jù)治理與智能發(fā)展等方面的思考,但更注重幫助企業(yè)挖掘行業(yè)大模型的潛力。AIOS 5.0核心特點(diǎn)是基于各行各業(yè)場景的X模態(tài)數(shù)據(jù),構(gòu)建行業(yè)基座大模型。

圖片

(圖源:第四范式官網(wǎng))

在能力層面,它側(cè)重于Predict the Next “X”,X代表各大行業(yè)包羅萬象的邏輯和結(jié)果。在使用層面,在支持接入企業(yè)各類模態(tài)數(shù)據(jù)的基礎(chǔ)上,先知AIOS 5提供大模型訓(xùn)練、精調(diào)等低門檻建模工具、科學(xué)家創(chuàng)新服務(wù)體系、北極星策略管理平臺、大模型納管平臺、主流算力適配優(yōu)化等能力,實(shí)現(xiàn)端到端的行業(yè)大模型的構(gòu)建、部署、管理服務(wù)。在應(yīng)用層面,考慮到中國的產(chǎn)業(yè)和場景復(fù)雜度水平極高,實(shí)際為行業(yè)大模型垂直發(fā)展提供了環(huán)境。

這其實(shí)是中國AI公司基于產(chǎn)業(yè)背景發(fā)展的一個極佳案例。戴文淵曾說:“我們國內(nèi)有大量場景和數(shù)據(jù)優(yōu)勢,當(dāng)我們覆蓋場景足夠多,把這些模型拼起來,最后你可能也實(shí)現(xiàn)了AGI。”相比之下,現(xiàn)在流行的很多行業(yè)大模型,依然還是行業(yè)大語言模型,大而不精。劃分到更精準(zhǔn)的場景后,雖然表面上看起來需要建立很多個大模型,但每個精準(zhǔn)場景的數(shù)據(jù)量負(fù)載有限,同時有自動化技術(shù)的幫助,反而另辟蹊徑實(shí)現(xiàn)了AGI在應(yīng)用層面的發(fā)展。

如同Mike Knoop的觀點(diǎn),AGI之所以在狂飆突進(jìn)后迅速遇到了上行阻礙,是因?yàn)槲覀冞^度依賴語言大模型,把AGI定義為能完成大多數(shù)工作的系統(tǒng),但AGI實(shí)際上應(yīng)該更側(cè)重高效獲取的新的能力,解決各種場景下的開放性問題。

事實(shí)上,這也許才是正確的思路。英偉達(dá)CEO黃仁勛就在美國加州理工學(xué)院第130屆畢業(yè)典禮講話中提到,隨著大模型發(fā)展,計(jì)算機(jī)從指令驅(qū)動轉(zhuǎn)向意圖驅(qū)動,“將來的應(yīng)用程序所做的和執(zhí)行的都會與我們做事的方式相似,組建專家團(tuán)隊(duì),使用工具、推理、計(jì)劃和執(zhí)行我們的任務(wù)”。這樣的邏輯本身就意味著通用性。所以我們也看到,大模型正在進(jìn)入物理世界,因?yàn)槲锢硎澜绲臎Q策同樣有跡可循。

類似的例子,就像過去一年多時間因AI技術(shù)估值暴漲兩倍多的Palantir。Palantir原本是一家To G的大數(shù)據(jù)公司,基于數(shù)據(jù)分析和建模仿真輔助決策,但生成式AI技術(shù)令其處理數(shù)據(jù)的方式發(fā)生轉(zhuǎn)變,在自動化與數(shù)據(jù)決策方面進(jìn)步甚多,加速了AI To B業(yè)務(wù)的開拓。第四范式,就是在每個具有確定性的場景中建立行業(yè)大模型,助力企業(yè)掌握自己的應(yīng)用,做出有效的決策。

圖片

(圖源:雪球)

最后,回到關(guān)于未來前景的思考上。OpenAI過于注重把通用能力做到極致,因而暫時失去了占據(jù)特定領(lǐng)域產(chǎn)品優(yōu)勢的機(jī)會。相比之下,那些側(cè)重于發(fā)展更自由、更開放的模型的企業(yè),都得到了發(fā)展機(jī)會。而在商業(yè)模式上,以訂閱為主導(dǎo)的OpenAI會繼續(xù)“出售”大模型的能力,更像是工具;而第四范式、Glean、Scale AI、Palantir等公司則是銷售技術(shù)及其附加組件和服務(wù),更像一個系統(tǒng)。

Scale AI上半年以138億美元估值融資了10億美元。成立五年的Glean在 D 輪融資中籌集了2億美元巨款,估值已高達(dá)22億美元,換算成人民幣在160億元左右。第四范式在港股的估值穩(wěn)定在224億港元左右,其成長性應(yīng)該主要掛鉤先知平臺的發(fā)展和收入。今年一季度,第四范式8.28億元的總營收中,先知平臺占5億元,比例為60.6%。隨著應(yīng)用場景的增加和收入的增長,它的價值也會得到釋放。

最終,AI公司在通往AGI的道路上一定免不了和行業(yè)巨頭對比。但只要它們能生產(chǎn)出越來越多的能在實(shí)際場景中為企業(yè)創(chuàng)造價值的產(chǎn)品時,市場自然會為它們賦予不一樣的價值。AGI是個巨大的概念,一切探索對未來而言都是有益的。

來源:港股研究社

       原文標(biāo)題 : 中國AI公司可以不走尋常路

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號