訂閱
糾錯(cuò)
加入自媒體

玩瘋了的ChatGPT不止AIGC,Maas或成為下一個(gè)增長(zhǎng)大爆發(fā)?

ChatGPT被玩瘋了!

12月1日,OpenAI發(fā)布了一個(gè)NLP(自然語(yǔ)言識(shí)別)的新模型ChatGPT,該模型是OpenAI在2020年推出的NLP預(yù)訓(xùn)練模型——GPT-3的衍生產(chǎn)品,不僅可以完成對(duì)答、寫劇本、寫代碼等各項(xiàng)功能,還可以創(chuàng)作詩(shī)歌和笑話,就連馬斯克也在感嘆“很多人瘋狂地陷入了ChatGPT循環(huán)中”,“ChatGPT 好得可怕,我們離強(qiáng)大到危險(xiǎn)的人工智能不遠(yuǎn)了”。

TED負(fù)責(zé)人Chris更是對(duì)紐約時(shí)報(bào)沒(méi)有報(bào)道ChatGPT表示震驚,ChatGPT在引起全網(wǎng)熱情“調(diào)戲”的同時(shí),也被業(yè)內(nèi)公認(rèn)為是NLP及人工智能領(lǐng)域具有重要意義的一款模型。

小編也上手把玩了一下,沒(méi)想到ChatGPT寫起小說(shuō)來(lái)也相當(dāng)強(qiáng)悍,其生成故事的流暢度和邏輯性堪比人類。

ChatGPT爆火的背后除了是AIGC(AI Generated Content)的故事,但不可忽視的一個(gè)更重要的推手是以Generative Pre-trained Transformer3(GPT-3)為代表的AI大模型的崛起,大模型的力量讓工業(yè)級(jí)AI的“奇點(diǎn)”越來(lái)越逼近。

大模型的魅力:工具的復(fù)利???????

就像熟食的出現(xiàn),讓廚藝不精的人,解決了做菜的難題,只要回家再二次烹飪一下,便可成為一頓美味佳肴,誰(shuí)又在乎前面98%的步驟都是在餐廳完成的呢?

工具或產(chǎn)品的本質(zhì)目的,是面向生產(chǎn)力的解放和升級(jí),衡量一個(gè)工具生命力的重要指標(biāo)是其能否產(chǎn)生復(fù)利效應(yīng),只有具備遍及性、普惠性、規(guī);、通用能力的工具才能得以流行,開(kāi)啟一個(gè)產(chǎn)業(yè)級(jí)生態(tài)甚至是一個(gè)時(shí)代。

AI大模型的走熱,是工具爆發(fā)周期規(guī)律的使然。

曾投資過(guò)Uber、Robinhood的著名天使投資人Jason,這個(gè)月在他的播客問(wèn)答中,談到工具爆發(fā)的周期,他總結(jié)到:階段一是愛(ài)好者的工具,比如說(shuō)以前圖片愛(ài)好者用Photoshop處理圖片,但是大部分人是不會(huì)用PS的,因?yàn)閷W(xué)起來(lái)非常困難;階段二是從愛(ài)好者的工具到普通人的工具,比如說(shuō)從PS到美圖秀秀,這個(gè)階段工具的使用難度大大降低;階段三是從普通人的工具到平臺(tái),這個(gè)是真正突破性的,是最需要商業(yè)想象力和商業(yè)直覺(jué)的,比如說(shuō)從美圖秀秀,到Instagram,現(xiàn)在你可以直接在社交平臺(tái)P完圖分享到你的社交網(wǎng)絡(luò);最后是從平臺(tái)成為行業(yè)。

而AI也正在經(jīng)歷類似的歷程。

不可否認(rèn),到了2022年,依然可以看到大部分云計(jì)算和AI供應(yīng)商無(wú)暇去高權(quán)重的投入AI的應(yīng)用場(chǎng)景和應(yīng)用可行性,而是專注于另一個(gè)關(guān)鍵詞:成本。

一如商湯科技聯(lián)合創(chuàng)始人揚(yáng)帆曾表示:AI替代人工,表面上是個(gè)需求問(wèn)題,但實(shí)際上是個(gè)成本問(wèn)題。

雖然人人都知道手磨咖啡好喝,但讓每個(gè)人都去磨咖啡顯然不現(xiàn)實(shí)。

回到云計(jì)算和AI服務(wù)提供商這邊,雖然面向企業(yè)賣AI理論上潛力巨大,但每家客戶都有大量需要定制解決的需求,往往要投入眾多行業(yè)專家、算法架構(gòu)師、軟硬件工程師來(lái)解決一些小問(wèn)題。這樣做出來(lái)的成果雖然可觀,但其實(shí)只具備案例性質(zhì),缺乏推廣可能。

另一方面,中國(guó)與歐美截然不同的生存土壤和To B環(huán)境,讓中國(guó)式AI走向高度工業(yè)化的愿景和需求更為強(qiáng)烈,一個(gè)顯見(jiàn)的區(qū)別就是歐美的AI to B市場(chǎng)凈值較高,客戶數(shù)字化能力較強(qiáng),他們的AI面對(duì)的客群,更多是大規(guī)模、分散式的企業(yè)軟件市場(chǎng),而中國(guó)的AI目標(biāo)用戶則更多是政企、實(shí)體經(jīng)濟(jì)企業(yè),數(shù)字化能力參差不齊,需要一對(duì)一的AI能力和通用化的AI解決方案,可以說(shuō),低成本的AI工業(yè)化,已成為目前中國(guó)AI產(chǎn)業(yè)的主線任務(wù)。

而AI大模型的出現(xiàn),或成為AI工業(yè)化的最佳解,其可重復(fù)利用的通用能力,正踩在了工具爆發(fā)周期的前站,開(kāi)啟了從作坊式的人工智能邁向通用智能的里程碑。

那么AI大模型是什么?

AI大模型就是Foundation Model(基礎(chǔ)模型),指通過(guò)在大規(guī)模寬泛的數(shù)據(jù)上進(jìn)行訓(xùn)練后能適應(yīng)一系列下游任務(wù)的模型。即以“預(yù)訓(xùn)練大模型+下游任務(wù)微調(diào)”的方案,直接在海量通用的、無(wú)標(biāo)注的數(shù)據(jù)上自監(jiān)督訓(xùn)練,捕獲知識(shí),通過(guò)將知識(shí)存儲(chǔ)到大量的參數(shù)中并對(duì)特定任務(wù)進(jìn)行微調(diào),從而提高模型的泛化能力和通用問(wèn)題求解能力。

簡(jiǎn)而言之,大模型就相當(dāng)于“熟制品”,企業(yè)買回去,進(jìn)行二次加工,從而可以生成自己想要的AI能力,其在大數(shù)據(jù)集訓(xùn)練的預(yù)訓(xùn)練模型上再完成小數(shù)據(jù)的遷移,最終在企業(yè)用戶時(shí)間、人力成本的平衡的基礎(chǔ)上,保證了模型的精度和使用效果,這種大模型預(yù)訓(xùn)練的邏輯成為了工業(yè)級(jí)AI的核心思路之一,讓AI變得像齒輪、軸承、鋼筋一樣,成為標(biāo)準(zhǔn)化、規(guī);⒘鞒袒、低成本的產(chǎn)物。

就像速泡茶包和傳統(tǒng)烹茶一般,傳統(tǒng)烹茶滿足了精致主義者和鐘愛(ài)品茶人士的味蕾,但只有看似不夠高端、廉價(jià)的速泡茶包才能飛入尋常百姓家,同樣也凝聚了制茶工藝的精髓,而中國(guó)AI要做的,就是炮制出這樣方便快捷、標(biāo)準(zhǔn)化的速泡茶包。

AI大模型“先富帶后富”

三類廠商成受益者??????????

在未來(lái),人工智能所期盼的終極圖景,就是像供水供電一樣流向終端,流向用戶、流向企業(yè),誰(shuí)能先做到這點(diǎn),誰(shuí)就會(huì)在AI 產(chǎn)業(yè)布局中獲得先發(fā)優(yōu)勢(shì)。

在發(fā)力大模型這一選擇上,巨頭們便是抱著這一信念,賭一次,賭對(duì)了,就值了。

于是,AI大模型軍備競(jìng)賽開(kāi)始打響,國(guó)外有谷歌、微軟、Meta,國(guó)內(nèi)有華為、阿里、百度、浪潮等企業(yè)均下場(chǎng)參戰(zhàn),模型平均參數(shù)上百億。

例如,谷歌Switch Transformer,采用了“Mixture of experts”(多專家模型),把數(shù)據(jù)并行、模型并行、expert并行三者結(jié)合在一起,實(shí)現(xiàn)了某種意義上的“偷工減料”——增大模型參數(shù)量,但不增大計(jì)算量。

再例如,浪潮發(fā)布的“源1.0”,參數(shù)規(guī)模2457億,采用了5000GB中文數(shù)據(jù)集,是一個(gè)創(chuàng)作能力、學(xué)習(xí)能力兼優(yōu)的中文AI大模型。據(jù)開(kāi)發(fā)者介紹,由于中文特殊的語(yǔ)言特點(diǎn),會(huì)為開(kāi)發(fā)者帶來(lái)英文訓(xùn)練中不會(huì)遇到的困難。這意味著,想要做出和GPT-3同樣效果的中文語(yǔ)言模型,無(wú)論是大模型本身,還是開(kāi)發(fā)者,都需要付出更大的力氣。

而且巨頭們大多不止一個(gè)基礎(chǔ)模型,從自然語(yǔ)言模型,到視覺(jué)模型,再到多模態(tài)模型,AI大模型的天花板越來(lái)越高。

不難發(fā)現(xiàn),涉及萬(wàn)億級(jí)參數(shù)、擁有“巨量數(shù)據(jù)、巨量算法、 巨量算力”三大特征的AI大模型是一項(xiàng)門檻很高的技術(shù)競(jìng)賽,只有科技巨頭才有實(shí)力研發(fā)工業(yè)級(jí)別的AI大模型,然后科技巨頭再開(kāi)放給各行各業(yè)的開(kāi)發(fā)者,這種“先富帶后富”的路子正是AI大模型的落地方式,在落地的前半段賽程,科技巨頭們成為“飲頭啖湯”者。

云計(jì)算廠商、AI芯片巨頭和數(shù)據(jù)密集型巨頭將會(huì)這一波AI大模型化浪潮的核心受益者,大模型帶來(lái) AI 底層基礎(chǔ)技術(shù)架構(gòu)的統(tǒng)一,以及對(duì)算力的龐大需求等特征,天然有利于云計(jì)算公司在此過(guò)程中發(fā)揮基礎(chǔ)性角色,云計(jì)算具有全球分布最為廣泛、最為強(qiáng)大的硬件算力設(shè)施,同時(shí) AI 框架、通用算法最為一種典型 PaaS 能力,亦傾向于被整合到云廠商的平臺(tái)能力當(dāng)中。因此從技術(shù)通用性、實(shí)際商業(yè)需求等維度,在大模型的推動(dòng)下,云計(jì)算巨頭有望逐步成為算力設(shè)施+基礎(chǔ)算法框架環(huán)節(jié)能力的主要提供商。

而AI芯片巨頭的算力能力是天然護(hù)城河,既可以支持自研模型,也可以成為大模型廠商的供應(yīng)商,賣算力,兩邊通吃,而坐擁獨(dú)特專用數(shù)據(jù)的數(shù)據(jù)密集型巨頭,如微信掌握的社交數(shù)據(jù),騰訊視頻的視頻數(shù)據(jù),阿里淘寶掌握的購(gòu)物數(shù)據(jù),在行業(yè)大模型的訓(xùn)練上,具有得天獨(dú)厚的優(yōu)勢(shì)。

Maas或成為下一個(gè)增長(zhǎng)大爆發(fā)

目前來(lái)看,巨頭們狂練AI大模型,一部分是為了賣,另一部分主要是基于反哺自身的產(chǎn)品和業(yè)務(wù)線,比如騰訊的混元模型,是為了優(yōu)化營(yíng)銷全鏈路,幫助廣告主促成交易達(dá)成,為其帶來(lái)更高效的投放轉(zhuǎn)化效果,微軟的大模型是用在Office套件上,谷歌的BERT模型也是為了優(yōu)化搜索引擎的搜索準(zhǔn)確性。

盡管,在現(xiàn)有AI大模型的商業(yè)結(jié)構(gòu)中,“賣”的比重并不高,但或許可以期待下,在AI工業(yè)化推廣的剛需下,在AI能力成為企業(yè)IT基礎(chǔ)設(shè)施標(biāo)配的趨勢(shì)下,Maas模式(Model as a service,模型即服務(wù))作為新興商業(yè)模式的爆發(fā)可能性,除了開(kāi)源,Maas將是AI走向普惠的最有可行性和網(wǎng)絡(luò)效應(yīng)的第二條路,國(guó)外有“huggingface”,而中國(guó)的“huggingface”或許要從Maas的探索中誕生,無(wú)論是結(jié)合Paas模式,整合為大平臺(tái),還是以產(chǎn)品形式單點(diǎn)輸出,復(fù)制Saas的企服路線,中國(guó)企業(yè)、研發(fā)人員們?yōu)锳I模型的付費(fèi)能力是不容小覷的。


       原文標(biāo)題 : 玩瘋了的ChatGPT不止AIGC,Maas或成為下一個(gè)增長(zhǎng)大爆發(fā)?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)