春節(jié)前,人工智能組織OpenAI推出的大模型ChatGPT,驚艷四座。這讓中國(guó)人工智能圈“有點(diǎn)上火”。國(guó)內(nèi)業(yè)界在迅速反思和行動(dòng):我們的差距在哪里?我們將如何正視和改進(jìn)不足?哪些又是中國(guó)從業(yè)者的機(jī)會(huì)?
文|趙艷秋 徐鑫
編|周路平
春節(jié)前,人工智能組織OpenAI推出的大模型ChatGPT,在國(guó)內(nèi)業(yè)界引起了不小的轟動(dòng)。
一名AI從業(yè)者告訴數(shù)智前線,人工智能每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。但這兩次大家的心態(tài)迥然不同,當(dāng)谷歌的AI下棋戰(zhàn)勝圍棋世界冠軍時(shí),大家當(dāng)新聞看,但這一次許多人是從消費(fèi)者的角度來(lái)體驗(yàn)它。一個(gè)月里,全世界100萬(wàn)用戶在使用和體驗(yàn)它,這是非常顛覆性的體驗(yàn)。這也是AI第一次大規(guī)模的自傳播。
數(shù)智前線獲悉,除了感嘆于ChatGPT的驚艷體驗(yàn)外,國(guó)內(nèi)業(yè)界也在迅速反思和行動(dòng):我們的差距在哪里?我們將如何正視和改進(jìn)不足?哪些是中國(guó)從業(yè)者的機(jī)會(huì)?
一名從業(yè)人士告訴數(shù)智前線,ChatGPT出現(xiàn)后,行業(yè)重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。
01
中美差距究竟有多大
在ChatGPT推出后,一位百度資深人士告訴數(shù)智前線,他“沒有興趣”談?wù)揅hatGPT,言語(yǔ)之間,五味雜陳。一位人工智能企業(yè)創(chuàng)始人稱,面對(duì)ChatGPT的驚艷表現(xiàn),心癢癢也迷茫,失眠了。他坦承,從模型的規(guī)模到效果,差距還比較遠(yuǎn)。
有人用同樣的問題向國(guó)內(nèi)某廠商的大模型和ChatGPT同時(shí)發(fā)問,ChatGPT從回答的邏輯性和完整度上都遠(yuǎn)超國(guó)內(nèi)大模型,國(guó)內(nèi)大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內(nèi)容。而且,在回復(fù)速度上,ChatGPT也領(lǐng)先一截。
從事數(shù)字人研發(fā)的特看科技CEO樂乘認(rèn)為,目前全球還沒有能跟ChatGPT抗衡的大模型,業(yè)界共識(shí)是差距在兩年以上。國(guó)內(nèi)先不談彎道超車,趁早追趕反而是更重要的。
雖然一些人工智能資深人士認(rèn)為,在ChatGPT所涉及的技術(shù)上,中美是“平級(jí)”的,但華為諾亞方舟實(shí)驗(yàn)室語(yǔ)音語(yǔ)義首席科學(xué)家劉群,在黃大年茶思屋的討論中坦承,中國(guó)在技術(shù)上還是有差距的。其中一個(gè)是基礎(chǔ)模型本身的差距,雖然我們訓(xùn)練了很多萬(wàn)億模型或者是幾千億的模型,但訓(xùn)練的充分程度,是遠(yuǎn)遠(yuǎn)不夠的!拔夜烙(jì)到現(xiàn)在為止,沒有哪個(gè)模型能吃GPT那么多數(shù)據(jù)!
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授黃民烈提到,在GPT-3之后,OpenAI所有的模型都沒有開源,但它提供了API調(diào)用。在這個(gè)過程中,它干了一件事,就是建立起了真實(shí)的用戶調(diào)用和模型迭代之間的飛輪,它非常重視真實(shí)世界數(shù)據(jù)的調(diào)用,以及這些數(shù)據(jù)對(duì)模型的迭代。當(dāng)然,在此過程中,它也養(yǎng)活了美國(guó)一大幫創(chuàng)業(yè)公司,建立了一個(gè)生態(tài)。
“你看我們國(guó)內(nèi)的大模型研究,是A公司訓(xùn)練了一個(gè),B公司也訓(xùn)練了一個(gè),打個(gè)廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把數(shù)據(jù)和模型的飛輪完整轉(zhuǎn)起來(lái)。所以,我覺得這是我們趕超ChatGPT的難點(diǎn)。”一位業(yè)內(nèi)人士坦言。
除此之外,業(yè)界人士都提到了算力問題。由于GPU芯片等問題,在一定程度上,國(guó)內(nèi)算力已被卡脖子了。即使國(guó)內(nèi)頭部公司,從算力上跟谷歌等相比,差距也是比較明顯的。
從數(shù)據(jù)質(zhì)量來(lái)說(shuō),整個(gè)互聯(lián)網(wǎng)的中文數(shù)據(jù)質(zhì)量,相比于英文還是有明顯差距。“我們可能要想辦法,做中英文不同語(yǔ)言之間的數(shù)據(jù)互補(bǔ)!庇袠I(yè)內(nèi)人士稱。
此外,幾乎所有受訪人士都提到了OpenAI這家人工智能組織,所體現(xiàn)的純碎創(chuàng)新精神和長(zhǎng)期主義!捌鋵(shí)從原理和方法看,他們所做的東西業(yè)界都是了解的,倒沒有說(shuō)什么是美國(guó)做得了、我們做不了的。”云知聲董事長(zhǎng)梁家恩對(duì)數(shù)智前線說(shuō),但像OpenAI和DeepMind,他們可能是業(yè)界唯二的兩家機(jī)構(gòu),無(wú)論在創(chuàng)新性、投入、決心,還是在頂尖人才儲(chǔ)備上,都是一如既往堅(jiān)持的!拔覀兛吹降氖浅晒,但里面可能已經(jīng)有很多失敗的嘗試。”
有資深A(yù)I從業(yè)者認(rèn)為,在看不到前景和沒有明顯效果的階段,OpenAI非常堅(jiān)定地做了投入,相反國(guó)內(nèi)傾向于在技術(shù)出現(xiàn)突破后,快速追隨!皣(guó)內(nèi)大家第一步想的是,我們現(xiàn)在怎么用起來(lái),但在不能用的時(shí)候,人家就在長(zhǎng)期投入!
“這件事其實(shí)是值得我們學(xué)習(xí)的,我們真的需要有足夠多的錢,有這么一幫熱血的人才,能夠在一個(gè)方向上這樣持續(xù)積累發(fā)力,我覺得這是一個(gè)非常必要的條件!秉S民烈稱。
最近一段時(shí)間,業(yè)界也在討論中國(guó)企業(yè)能否超越。容聯(lián)云AI研究院院長(zhǎng)劉杰告訴數(shù)智前線,圍繞業(yè)務(wù),尤其是國(guó)內(nèi)的場(chǎng)景,是有超越機(jī)會(huì)的。在局部應(yīng)用中開始超越,這也是業(yè)界的共識(shí)。
02
對(duì)中國(guó)人工智能界有何啟發(fā)
ChatGPT是一種大模型。在它推出之前,國(guó)內(nèi)外實(shí)際上已有不少大模型。相比其他大模型,它有了業(yè)界意料之外的突破,也給國(guó)內(nèi)業(yè)界帶來(lái)啟發(fā)。
首先,ChatGPT有一個(gè)非常強(qiáng)大的技術(shù)底座,也就是InstructGPT模型。但這個(gè)模型的論文剛發(fā)出來(lái)時(shí),沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。梁家恩也告訴數(shù)智前線,此前,GPT與BERT模型路線一直在競(jìng)爭(zhēng),2018年時(shí)BERT模型先贏了,但GPT模型路線一直沒放棄,模型參數(shù)和數(shù)據(jù)規(guī)模越做越大,最終結(jié)合人工反饋增強(qiáng)學(xué)習(xí)(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。因此,業(yè)內(nèi)公司正在關(guān)注投入更大精力到GPT模型路線上,技術(shù)路線交替競(jìng)爭(zhēng),在業(yè)內(nèi)是常態(tài)。
其次,ChatGPT引入了強(qiáng)化學(xué)習(xí)機(jī)制。容聯(lián)云劉杰告訴數(shù)智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標(biāo)注的數(shù)據(jù)去學(xué)習(xí),還在新版本上引入了人工標(biāo)注的數(shù)據(jù),通過人類的反饋,有針對(duì)性地進(jìn)行優(yōu)化!斑@是ChatGPT一個(gè)重要的進(jìn)展,給了我們很大的啟發(fā)。”
“這是它核心的一點(diǎn)!比A為終端云服務(wù)搜索與地圖BU總裁趙世奇稱,“今天,我們的模型越來(lái)越大,它就像一股洪荒之力,有人會(huì)害怕未來(lái)它會(huì)不會(huì)控制人類?但引入了這種強(qiáng)化學(xué)習(xí)機(jī)制后,就相當(dāng)于給洪荒之力一個(gè)引導(dǎo),讓大模型的產(chǎn)出朝著可控的方向走,生成符合預(yù)期的結(jié)果!北热,你去問它一些倫理安全的敏感話題,它都能答得很好。
這里的難度是建立怎樣的強(qiáng)化學(xué)習(xí)機(jī)制。此前,在下圍棋的AI中,強(qiáng)化學(xué)習(xí)是用勝負(fù)做反饋。但對(duì)于ChatGPT如此開放的系統(tǒng),是沒有明確的反饋機(jī)制的。黃民烈稱,過去大家也嘗試了強(qiáng)化學(xué)習(xí)機(jī)制,但很多都不太成功。ChatGPT在這件事上取得了突破。
第三,它在數(shù)據(jù)質(zhì)量和多樣性上非常講究。OpenAI雇傭了一個(gè)數(shù)十人的數(shù)據(jù)團(tuán)隊(duì),其實(shí)ChatGPT強(qiáng)化學(xué)習(xí)的數(shù)據(jù)量并不大,但對(duì)數(shù)據(jù)多樣性、標(biāo)注體系都有精巧的設(shè)計(jì),讓數(shù)據(jù)發(fā)揮出了強(qiáng)大的作用。業(yè)內(nèi)認(rèn)為,這確實(shí)是值得我們借鑒的地方。
當(dāng)然,ChatGPT也有明顯的不足。大家公認(rèn)的,是它善于一本正經(jīng)地胡說(shuō)八道。劉杰告訴數(shù)智前線,ChatGPT是一個(gè)黑盒計(jì)算,當(dāng)下在內(nèi)容的可信性和可控性上有一定局限。“我們要給它足夠正確的知識(shí),再引入知識(shí)圖譜這類知識(shí)管理和信息注入技術(shù),還要限定它的數(shù)據(jù)范圍和應(yīng)用場(chǎng)景,使得它生成的內(nèi)容更為可靠,這是我們?cè)谧龅!?/p>
ChatGPT在AI的技術(shù)路線和訓(xùn)練方式上的變革,讓人關(guān)注它對(duì)產(chǎn)業(yè)帶來(lái)的改變。特看科技CEO樂乘預(yù)計(jì),很多單點(diǎn)環(huán)節(jié)里,用不用大模型會(huì)有天壤之別。沒用大模型,只基于自己上一代小模型做產(chǎn)品的企業(yè),跟應(yīng)用了大模型且還做了業(yè)務(wù)垂直化的公司,將無(wú)法競(jìng)爭(zhēng)。
多名創(chuàng)業(yè)者談及,這兩年創(chuàng)業(yè)市場(chǎng)垂頭喪氣,所有人都在探尋能夠大幅度提升生產(chǎn)力的技術(shù)是什么!癈hatGPT其實(shí)提供了一種新的范式。垂頭喪氣、青黃不接的狀態(tài)可能會(huì)成為過去。這個(gè)領(lǐng)域出幾家千億級(jí)別的公司是完全有可能的。”樂乘說(shuō)。
03
中國(guó)企業(yè)的動(dòng)作
ChatGPT推出后,很多人在講谷歌、百度的焦慮。但大多數(shù)中國(guó)業(yè)內(nèi)人士認(rèn)為,目前ChatGPT還是一個(gè)對(duì)AI技術(shù)范式的探索,它并不能代替搜索。ChatGPT當(dāng)下一個(gè)很大的弊端是無(wú)法實(shí)時(shí)獲取互聯(lián)網(wǎng)信息。由于它只是一個(gè)端到端的生成模型,能夠自我構(gòu)造虛假答案,這些都是它替代搜索的障礙。而如果以目前每一條幾美分的成本來(lái)看,它會(huì)讓商業(yè)搜索引擎公司入不敷出。
它作為搜索引擎的補(bǔ)充是有機(jī)會(huì)的,因?yàn)樗阉饕嬉仓v求“所問即所答”,但這還有一個(gè)發(fā)展過程。
劉杰認(rèn)為,ChatGPT主要的產(chǎn)業(yè)化路徑,目前可能性比較大的首先還是在C端。由于ChatGPT展現(xiàn)出的大模型的創(chuàng)造性,以及對(duì)長(zhǎng)篇上下文的理解能力,它可能會(huì)聚焦于一些開放性、創(chuàng)意性和通用性的任務(wù)上。
不過,中國(guó)企業(yè)在行業(yè)市場(chǎng)的探索已經(jīng)開啟。比如,在智能客服領(lǐng)域,云蝠智能CEO魏佳星告訴數(shù)智前線,上個(gè)月他們?cè)谝恍﹫?chǎng)景嘗試引入ChatGPT來(lái)做外呼的Demo測(cè)試,調(diào)用ChatGPT來(lái)回復(fù)客戶的問題。
“在智能客服領(lǐng)域應(yīng)用這項(xiàng)技術(shù),核心點(diǎn)在大模型的NLP(自然語(yǔ)言處理)能力和此前企業(yè)里已有的NLP之間怎么結(jié)合!蔽杭研钦f(shuō)。例如幫助順豐去做回訪的快遞通知體系,是基于幾個(gè)標(biāo)準(zhǔn)動(dòng)作而進(jìn)行,在這個(gè)封閉條件下應(yīng)該優(yōu)先企業(yè)已有的技術(shù),滿足客戶當(dāng)下的核心需求。
在這個(gè)需求之外,此前智能客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語(yǔ)料信息不充分時(shí),AI沒辦法對(duì)問題做出反應(yīng),ChatGPT大模型能夠補(bǔ)全這方面的能力。魏佳星反饋,云蝠智能外呼的Demo測(cè)試效果較好。在其他行業(yè)里這項(xiàng)技術(shù)可能仍處于娛樂狀態(tài),但在智能客服領(lǐng)域,ChatGPT已具備商用潛力。
從事通訊及數(shù)字化服務(wù)的上市企業(yè)容聯(lián)云,從2021年圍繞著人機(jī)智能對(duì)話,做核心技術(shù)和產(chǎn)品研發(fā),比如智能客服。目前,在研發(fā)與ChatGPT類似的人工智能內(nèi)容生成產(chǎn)品。
但就模型的規(guī)模,劉杰有不同的看法!癈hatGPT的優(yōu)勢(shì)是它的大帶來(lái)的,但在應(yīng)用落地上,由于它過大,也帶來(lái)了挑戰(zhàn)和局限。”他告訴數(shù)智前線,“脫離場(chǎng)景去談大和小是沒有意義的。在特定應(yīng)用場(chǎng)景、特定條件約束下、在特定的數(shù)據(jù)上,去訓(xùn)練規(guī)模適宜的模型,是我們努力的目標(biāo)!
劉杰還稱,AI是一個(gè)鏈條比較長(zhǎng)的產(chǎn)品技術(shù),如果沒有建立一個(gè)好的反饋機(jī)制,在部署運(yùn)營(yíng)階段,從最前線發(fā)現(xiàn)的問題,就很難有效定位解決,所以要讓模型去持續(xù)成長(zhǎng)和優(yōu)化,“它不是靜態(tài)的,不是交付了就不再管它!
云知聲梁家恩告訴數(shù)智前線,他們一直密切跟進(jìn)業(yè)內(nèi)最前沿的算法,是最早把BERT和GPT2模型方法用到實(shí)際業(yè)務(wù)系統(tǒng)的團(tuán)隊(duì)之一,“現(xiàn)在相當(dāng)于是把基于BERT的技術(shù)框架做個(gè)升級(jí),目前已納入云知聲今年的技術(shù)升級(jí)目標(biāo)規(guī)劃中!绷杭叶髡f(shuō),ChatGPT的優(yōu)勢(shì)是意圖理解、上下文對(duì)話管理和高質(zhì)量?jī)?nèi)容生成,技術(shù)升級(jí)后,預(yù)計(jì)會(huì)帶來(lái)顯著的體驗(yàn)提升。
與其他企業(yè)一樣,云知聲的目標(biāo)是先走通,之后在既有的業(yè)務(wù)比如在IoT智能語(yǔ)音交互對(duì)話,以及醫(yī)療行業(yè)應(yīng)用中落地。梁家恩也提到了模型的規(guī)模問題,考慮商業(yè)化成本,實(shí)用模型的參數(shù)量最終可能要壓到10億量級(jí)。
商湯科技數(shù)字文娛事業(yè)部總經(jīng)理欒青告訴數(shù)智前線,商湯在AIGC的不同領(lǐng)域有多年布局,從文字,到圖片,以及視頻和動(dòng)畫的AIGC,團(tuán)隊(duì)都從技術(shù)和產(chǎn)業(yè)長(zhǎng)期投入,團(tuán)隊(duì)更多專注在視頻的AIGC,并疊加商湯自研的類似于GPT的生成式內(nèi)容進(jìn)行短視頻等創(chuàng)作,讓大家在創(chuàng)作的過程當(dāng)中,把生產(chǎn)效率提升,“這是我們的核心點(diǎn)”。
欒青表示,ChatGPT本質(zhì)上是基于AI大模型落地的應(yīng)用。而基于商湯的SenseCoreAI大裝置,在視覺大模型領(lǐng)域,商湯已訓(xùn)練和構(gòu)建了超過300億量級(jí)模型參數(shù)超大基模型,得以有效支持相關(guān)應(yīng)用。
出門問問創(chuàng)始人李志飛則告訴數(shù)智前線,出門問問從2019年底開始做生成式應(yīng)用,2020年GPT-3出來(lái)后一直在跟蹤大模型。目前發(fā)力的一個(gè)行業(yè)應(yīng)用是寫文案。
某游戲人工智能的資深開發(fā)者告訴數(shù)智前線,這項(xiàng)技術(shù)在游戲的用戶互動(dòng)環(huán)節(jié)和制作環(huán)節(jié)能看到應(yīng)用前景。比如用戶和NPC(一種角色)互動(dòng)對(duì)話時(shí)調(diào)用,由于ChatGPT對(duì)自然語(yǔ)言的優(yōu)秀理解能力,用戶和NPC互動(dòng)的開放性能大幅提升。另外在制作環(huán)節(jié)里,應(yīng)用ChatGPT,可通過關(guān)鍵詞生成故事線,能給策劃在劇情走向設(shè)計(jì)時(shí)提供參考。
另外,在數(shù)字人領(lǐng)域,特看科技CEO樂乘告訴數(shù)智前線,大模型讓數(shù)字人的內(nèi)容生產(chǎn)和交互方式發(fā)生了變化。
在沒有引入大模型之前,數(shù)字人說(shuō)話和行動(dòng)基本要靠真人行為去驅(qū)動(dòng)。有了大模型之后,內(nèi)容的輸出可以通過大模型來(lái)完成。以直播帶貨為例,數(shù)字人公司先給本地生活、知識(shí)付費(fèi)和直播商家等建立一個(gè)數(shù)字人的虛擬主播形象,而后可以將大模型接入,讓大模型輔助撰寫數(shù)字人直播帶貨的話術(shù)和腳本,“未來(lái)在我們關(guān)注的泛生活和電商賽道,可能有30%內(nèi)容能夠通過大模型生成來(lái)完成!睒烦苏f(shuō)。
04
ChatGPT在行業(yè)落地難
不過,業(yè)界資深人士提出,當(dāng)下ChatGPT在行業(yè)里要真正落地還面臨困難。
“商業(yè)模型上跑不通!蔽杭研菍(duì)數(shù)智前線說(shuō)。ChatGPT目前調(diào)用一次的費(fèi)用在幾美分,智能客服一天的問答場(chǎng)景,通常可能要調(diào)用幾十萬(wàn)次!拔覀円煌娫捠召M(fèi)才1.2毛,利潤(rùn)可能也就2分錢,現(xiàn)在的成本使得它根本跑不起來(lái)!拔杭研钦J(rèn)為,當(dāng)這項(xiàng)產(chǎn)品的調(diào)用成本降到1分錢時(shí),行業(yè)里可能就會(huì)大范圍使用起來(lái)。
游戲行業(yè)的開發(fā)者們也坦言,調(diào)用ChatGPT的成本和它當(dāng)下所帶來(lái)的回報(bào)可能并不成正比。幾美分只是調(diào)用費(fèi)用,還不算運(yùn)營(yíng)費(fèi)用。“沒有一個(gè)老板能接受,NPC回復(fù)一句話要花掉幾毛錢,即使它說(shuō)得再好!倍脩舻挠螒蝮w驗(yàn)是個(gè)系統(tǒng)工程,文本互動(dòng)只是其中的一環(huán)。當(dāng)下即使有廠商愿意不顧高成本使用ChatGPT,最終的用戶體驗(yàn)也依然可能無(wú)法有質(zhì)的飛躍。
在游戲制作環(huán)節(jié),ChatGPT可能也只能作為策劃和游戲設(shè)計(jì)環(huán)節(jié)的參考,“乍看中規(guī)中矩要素齊全,但細(xì)品會(huì)發(fā)現(xiàn)缺少靈魂,在觀念性的創(chuàng)造上仍有待提升”。
不過,樂乘對(duì)ChatGPT的成本問題相對(duì)樂觀。OpenAI公司自己也是初創(chuàng)團(tuán)隊(duì),沒有那么有錢。隨著競(jìng)爭(zhēng)加劇,大模型會(huì)像水電煤一樣,是大家都用得起的狀態(tài)。
刨除成本考量,在對(duì)企業(yè)的落地中,ChatGPT這類大模型,也有典型的問題。
容聯(lián)云劉杰舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對(duì)資源要求高,當(dāng)前不太可能實(shí)現(xiàn)私有化部署。其次,這些大模型在一些特定行業(yè)或特定任務(wù)上,專業(yè)性是欠缺的,需要去適配。而對(duì)于ChatGPT這類非開源的大模型應(yīng)用來(lái)說(shuō),對(duì)它在下游任務(wù)上的微調(diào),如何兼顧成本、靈活性和數(shù)據(jù)隱私則是一個(gè)關(guān)鍵問題。這些問題也造成,這種模型還沒有走到服務(wù)企業(yè)級(jí)客戶,尤其是大型企業(yè)客戶那一步。
除此之外,現(xiàn)在人工智能技術(shù)都在與企業(yè)的核心業(yè)務(wù)流程做深度融合,而像ChatGPT這個(gè)基于大模型的應(yīng)用服務(wù),更像一個(gè)獨(dú)立的外掛,如何深度綁定,這也成為企業(yè)使用它的一個(gè)待解決問題。
業(yè)界人士期望ChatGPT未來(lái)在商業(yè)模式上有更好的呈現(xiàn)方式。目前ChatGPT對(duì)外提供的API還非常單一,影響了應(yīng)用。
05
創(chuàng)業(yè)公司會(huì)被ChatGPT吞噬嗎
大家在期待OpenAI的下一個(gè)版本。GPT-3大模型發(fā)布于2020年, ChatGPT則基于它的改進(jìn)版本創(chuàng)建。此前盛傳,GPT-4將于今年一季度或下半年推出,不過OpenAI的首席執(zhí)行官 Sam Altman在1月份回應(yīng),沒有具體的時(shí)間表。
一些創(chuàng)業(yè)者已經(jīng)開始關(guān)注到,隨著大模型被越來(lái)越多地應(yīng)用,細(xì)分賽道的創(chuàng)業(yè)公司在大模型的強(qiáng)大推力加持下,如何尋找自己的生存空間。
它涉及到兩點(diǎn),首先是如何深化對(duì)垂直行業(yè)的認(rèn)知,真正把大模型融入到企業(yè)的創(chuàng)新業(yè)務(wù)流中。特看科技樂乘認(rèn)為,垂直行業(yè)的小模型,考驗(yàn)的是創(chuàng)業(yè)公司對(duì)垂直行業(yè)的know-h(huán)ow。創(chuàng)業(yè)公司需要基于對(duì)行業(yè)的認(rèn)知深度,采集足夠多的場(chǎng)景數(shù)據(jù),并基于這些細(xì)分?jǐn)?shù)據(jù)更好服務(wù)用戶。用戶越多,反饋越多,最終形成數(shù)據(jù)反饋的閉環(huán)。
創(chuàng)業(yè)公司在小模型的競(jìng)爭(zhēng)終局比拼的是,誰(shuí)家的小模型跟業(yè)務(wù)結(jié)合得緊,且能解決好跟大模型結(jié)合的問題。
另一點(diǎn)是,大模型被充分使用、喂得很肥后,是否會(huì)成為最強(qiáng)大的AI,最終吞噬細(xì)分賽道上小創(chuàng)業(yè)公司的發(fā)展空間。
海外初創(chuàng)公司Jasper的命運(yùn)頗能反映這種境況。Jasper是一家基于GPT-3大模型來(lái)生成營(yíng)銷文案的AI服務(wù)商,去年10月它宣布以15億美元的估值獲得1.25億美元A輪融資。一個(gè)月后,基于GPT-3改進(jìn)版本搭建的ChatGPT大火,智能程度更泛化的ChatGPT徹底蓋過了Jasper的風(fēng)頭。
“對(duì)創(chuàng)業(yè)者而言,在充分利用已有大模型的情況下,也要盡可能要把小模型的閉環(huán)數(shù)據(jù)保護(hù)好!碧乜纯萍紭烦苏f(shuō),這也是他們公司未來(lái)會(huì)重點(diǎn)攻克的方向。
不過,當(dāng)下底層大模型還在高速迭代階段,行業(yè)內(nèi)都在等 GPT-4 出來(lái)。樂乘認(rèn)為,從GPT-3到GPT-4的變遷,很像移動(dòng)互聯(lián)網(wǎng)早期 iPhone 1和 iPhone4 階段iOS的升級(jí)速度,它的發(fā)展速度也許會(huì)超出大家的認(rèn)知。
一些人士猜測(cè), GPT-4將在多模態(tài)上有進(jìn)展,也就是會(huì)引入視頻、音頻等。國(guó)內(nèi)某游戲人工智能的資深開發(fā)則告訴數(shù)智前線,他們關(guān)注的是下一代的大模型能不能在理解上下文上有突破!叭绻竽P湍茏屓斯ぶ悄艽蜈A辯論賽,那么它的能力就算是有質(zhì)的突破了!
“短期內(nèi)可能大家會(huì)高估這個(gè)東西,但長(zhǎng)期可能有很多人會(huì)低估這個(gè)東西!边@名游戲AI資深開發(fā)評(píng)價(jià)。