訂閱
糾錯(cuò)
加入自媒體

AIGC,喊出了元宇宙的“芝麻開門”

來源 | 伯虎財(cái)經(jīng)(bohuFN)

作者 | 陳平安

2022年8月,在美國(guó)科羅拉多州博覽會(huì)上,一幅名為《太空歌劇院》的繪畫作品贏得了數(shù)字類別的一等獎(jiǎng),但不少人對(duì)于這個(gè)獎(jiǎng)項(xiàng)的授予并不服氣。

爭(zhēng)議并不源自作品的質(zhì)量,而是這幅作品并不完全由畫師個(gè)人完成。游戲設(shè)計(jì)師Jason Allen首先是通過AI繪圖工具M(jìn)idjourney生成原畫,再經(jīng)過Photoshop潤(rùn)色,從而完成了這幅作品。

這并非AIGC(人工智能內(nèi)容生成)發(fā)展的孤例。就在月前,互聯(lián)網(wǎng)刮起了一陣ChatGPT風(fēng),起因是OpenAI發(fā)布了一個(gè)全新的聊天機(jī)器人模型—— ChatGPT。和過去那些聊天機(jī)器人相比,ChatGPT不僅可以回答人類的追問,承認(rèn)自己回答中的錯(cuò)誤,拒絕回答不適當(dāng)?shù)膯栴},還能寫詩(shī)和編程。根據(jù)外媒報(bào)道,有人甚至讓ChatGPT為自己寫論文并獲得了及格。

連馬斯克都忍不住感嘆:“ChatGPT好得嚇人,我們離強(qiáng)大到危險(xiǎn)的人工智能不遠(yuǎn)了。"

當(dāng)藝術(shù)界開始因?yàn)椤癆I繪畫到底算不算藝術(shù)品”而吵得不可開交,當(dāng)普羅大眾對(duì)ChatGPT的對(duì)話能力驚嘆不已,AIGC本身值得期待的就不再只是驚人的迭代和學(xué)習(xí)能力,而是作為一個(gè)生產(chǎn)力和生產(chǎn)工具的結(jié)合體,在生成內(nèi)容維度和智能化程度上所展現(xiàn)的潛力。

破解元宇宙內(nèi)容難題

一個(gè)公認(rèn)的事實(shí)是,制約元宇宙相關(guān)產(chǎn)業(yè)發(fā)展的重要瓶頸,是內(nèi)容生產(chǎn)上的不足。也許你會(huì)馬上反駁,最大的障礙難道不是技術(shù)的不成熟嗎?確實(shí),當(dāng)下無(wú)論是VR還是AR,交互技術(shù)和光學(xué)技術(shù)都無(wú)法達(dá)到大多數(shù)人對(duì)元宇宙期望的那樣。

但元宇宙相關(guān)產(chǎn)業(yè)的落地和發(fā)展并不完全依賴于這些硬件,無(wú)論是數(shù)字人還是元宇宙第一股Roblox都足以證明。

元宇宙當(dāng)前最大的挑戰(zhàn)反而是在內(nèi)容側(cè),如何提供能夠滿足各行各業(yè)需求的高質(zhì)量?jī)?nèi)容?

以數(shù)字人為例,"擬人化"和"自動(dòng)化"是判斷一個(gè)數(shù)字人等級(jí)的標(biāo)準(zhǔn)。在這個(gè)標(biāo)準(zhǔn)下,數(shù)字人被分為了L1-L5五個(gè)等級(jí)。其中L4級(jí)別的數(shù)字人能夠?qū)崿F(xiàn)部分智能化交互;L5級(jí)則能夠?qū)崿F(xiàn)完全智能化交互。從L4級(jí)別開始,數(shù)字人能夠逐漸替代真人去完成服務(wù)。

(來源:商湯智能產(chǎn)業(yè)研究院)

這也意味著,數(shù)字人產(chǎn)業(yè)的突破,和L4及以上級(jí)別的數(shù)字人能否量產(chǎn)息息相關(guān)。但一般一個(gè)數(shù)字人的生成需要經(jīng)過模型重建、動(dòng)畫準(zhǔn)備等多個(gè)過程,制作流程長(zhǎng)達(dá)數(shù)月,這種生產(chǎn)力上的不足也嚴(yán)重制約了數(shù)字人的普及。

AIGC正在成為打破這道瓶頸的關(guān)鍵。

從2016年創(chuàng)造SenseMARS平臺(tái)時(shí),AI龍頭商湯科技就開始從全景智能的角度布局AIGC各種能力。

到目前為止,商湯不僅在計(jì)算機(jī)視覺方面積累了超過49000個(gè)算法模型,覆蓋從視覺信號(hào)的分析理解到實(shí)現(xiàn)數(shù)字內(nèi)容的生成等各方面;也自研并具備了包括語(yǔ)音識(shí)別(ASR)、語(yǔ)義理解(NLP知識(shí)圖譜)、語(yǔ)音合成(TTS)以及語(yǔ)音動(dòng)畫合成(STA)等多項(xiàng)技術(shù)能力。

通過這些底層AI技術(shù)的迭代,商湯幾乎重塑了數(shù)字人的整個(gè)生產(chǎn)流程。

(來源:商湯智能產(chǎn)業(yè)研究院)

在傳統(tǒng) CG 建模環(huán)節(jié)里,商湯推出的智能化生成引擎可以基于少量照片的面部掃描,算法自動(dòng)生成高精度的3D 面部模型,大大減少了建模環(huán)節(jié)的投入和時(shí)間成本。

智能化驅(qū)動(dòng)引擎則通過STA等算法加速協(xié)調(diào)數(shù)字人的擬人化程度,讓其整體動(dòng)作表現(xiàn)更加自然,減輕了畫師的工作強(qiáng)度和人工成本。

而在決定數(shù)字人"自動(dòng)化"的多模態(tài)交互和深度學(xué)習(xí)能力構(gòu)建環(huán)節(jié),智能化交互引擎專注于提高數(shù)字人的智慧性;谡Z(yǔ)音識(shí)別(ASR)、語(yǔ)音合成(TTS)、自然語(yǔ)言理解(NLP)等技術(shù)組合,結(jié)合商湯所積累的海量特定知識(shí)領(lǐng)域的知識(shí)問答庫(kù),數(shù)字人不僅可以和用戶快速高效的建立對(duì)話關(guān)系,還能實(shí)現(xiàn)自身的深度學(xué)習(xí)和迭代升級(jí)。

同樣的例子在游戲產(chǎn)業(yè)也有所體現(xiàn)。

游戲是業(yè)內(nèi)公認(rèn)的元宇宙雛形之一,但當(dāng)下游戲產(chǎn)業(yè)發(fā)展的桎梏也很明顯,即內(nèi)容創(chuàng)新。傳統(tǒng)開發(fā)存在明顯的智能上限,這使得游戲很難持續(xù)為玩家提供情緒價(jià)值。在此條件下,游戲廠商們要么持續(xù)投入大量資金做內(nèi)容建設(shè),要么等待下一個(gè)天才策劃或者玩法的出現(xiàn)。

也因此,能夠快速、高質(zhì)量產(chǎn)出內(nèi)容的AIGC被視為了破局的關(guān)鍵。2021年商湯成立了智慧決策與游戲事業(yè)部,推出了SenseMAP。這款集合了商湯深度學(xué)習(xí)、智慧決策等前沿的AI技術(shù)的產(chǎn)品幾乎涵蓋了游戲開發(fā)的整個(gè)流程。

在游戲生態(tài)上,SenseMAP不僅能夠通過真實(shí)玩家游戲數(shù)據(jù)訓(xùn)練NPC,讓其具備類似真實(shí)玩家的游戲行為,還能讓其和普通玩家進(jìn)行互動(dòng)。

在內(nèi)容生態(tài)上,SenseMAP支持角色設(shè)計(jì)、動(dòng)作捕捉、人臉3D生成等多項(xiàng)功能,大大降低了角色的生產(chǎn)周期,滿足玩家的UGC需求。

隨著AIGC的發(fā)展和普及,過去那些耗費(fèi)巨大的知識(shí)性和創(chuàng)造性工作的邊際成本將大幅降低,過去制約元宇宙相關(guān)產(chǎn)業(yè)發(fā)展的內(nèi)容問題將迎刃而解,從而產(chǎn)生巨大的生產(chǎn)效率和經(jīng)濟(jì)價(jià)值。

可以預(yù)見的是,AIGC正站在元宇宙的石門前,喊出了那聲“芝麻開門”。

AIGC何以被點(diǎn)燃?

AIGC的本質(zhì)是內(nèi)容與場(chǎng)景,需要AI與后端基建,也就是算法、數(shù)據(jù)和算力共同生成。當(dāng)下,AIGC正朝著更強(qiáng)、更快、更低成本的方向發(fā)展。

一方面,隨著AI模型的通用性不斷提高,AIGC應(yīng)用的門檻在降低,效率卻在進(jìn)一步提高。

2015年以前,小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因?yàn)樾⌒偷哪P蛯?duì)于硬件的要求較低,同時(shí)和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點(diǎn)在于,對(duì)通用任務(wù)的處理表現(xiàn)并不好。換言之,他們很難針對(duì)特定領(lǐng)域或者場(chǎng)景去進(jìn)行定制。

在這個(gè)背景下,大模型脫穎而出。大模型可泛化能力強(qiáng),可以做到"舉一反三",同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個(gè)場(chǎng)景的任務(wù),從而擺脫小模型應(yīng)用碎片化、作坊式開發(fā)的特點(diǎn)。

這為AIGC進(jìn)入新階段提供了契機(jī)。以商湯為例,剖析其技術(shù)基座,商湯元宇宙主要基于SenseMARS火星混合現(xiàn)實(shí)平臺(tái)打造,目前該平臺(tái)內(nèi)含3,500個(gè)人工智能模型,包括感知智能、決策智能、智能內(nèi)容生成(包括增強(qiáng)現(xiàn)實(shí)、混合現(xiàn)實(shí))、軟件智能體及其他基礎(chǔ)設(shè)施(如云引擎等)。

基于SenseMARS,商湯能夠針對(duì)不同的行業(yè)拿出的方案,從而實(shí)現(xiàn)元宇宙相關(guān)產(chǎn)業(yè)的廣泛應(yīng)用。前文提到的數(shù)字人就是典型案例。商湯打造的AI數(shù)字人不僅在逼真程度上媲美真人,而且更聰明,能夠"聽得懂,看得見,說得出",很重要的原因在于商湯的AI數(shù)字人是由三種引擎(算法)共同打造的。

另一方面,算力、算法模型等后端基建相關(guān)的基礎(chǔ)設(shè)施建設(shè)加速了大模型的生產(chǎn)迭代,這為AIGC的廣泛應(yīng)用打下了基礎(chǔ)。

爆火的ChatGPT能夠?qū)崿F(xiàn)當(dāng)前的交互,就離不開OpenAI在AI預(yù)訓(xùn)練大模型領(lǐng)域的積累。從2018年起,OpenAI就開始發(fā)布生成式預(yù)訓(xùn)練語(yǔ)言模型GPT,可用于生成文章、代碼、機(jī)器翻譯、問答等各類內(nèi)容。

在這股預(yù)訓(xùn)練大模型的風(fēng)潮之下,是一場(chǎng)拼參數(shù)、拼算力的軍備競(jìng)賽。2018年,GPT的參數(shù)量還只有1.17億。隨后幾年,OpenAI每一代GPT模型的參數(shù)量都爆炸式增長(zhǎng)。到2020年5月,新發(fā)布的GPT-3參數(shù)量直接暴漲至1750億。

AI模型對(duì)算力的需求在過去短短幾年內(nèi)翻了大約100萬(wàn)倍,平均每年十幾倍,這個(gè)增速甚至超過了對(duì)算法精度增長(zhǎng)的需求。

算力即最核心的生產(chǎn)力。如何把握住驅(qū)動(dòng)AIGC的根本源動(dòng)力?商湯的人工智能基礎(chǔ)設(shè)施SenseCore AI大裝置在更早時(shí)候已給出了答案。

資料顯示,SenseCore商湯AI大裝置的核心由計(jì)算基礎(chǔ)設(shè)施、模型層、深度學(xué)習(xí)層三個(gè)部分架構(gòu)而成,分別對(duì)應(yīng)算力、算法模型生成和算法模型訓(xùn)練三個(gè)要素。

2022年,商湯在上海臨港的智算中心AIDC正式運(yùn)營(yíng),是亞洲最大的人工智能智能計(jì)算中心之一。得益于磅礴算力的加持,模型層中的商湯的SenseSpring“模型工廠”能夠快速生成穩(wěn)定可靠的模型,截至2022年6月,累計(jì)生產(chǎn)近50000個(gè)商用人工智能模型。

ChatGPT本質(zhì)上是基于NLP大模型落地的應(yīng)用。而基于SenseCore,在視覺大模型領(lǐng)域,商湯已訓(xùn)練和構(gòu)建了超過300億量級(jí)模型參數(shù)超大基模型,得以有效支持AIGC的應(yīng)用。

商湯2022年中報(bào)透露,公司在ImageNet大規(guī)模識(shí)別任務(wù)中實(shí)現(xiàn)超90%精度,和Google、微軟共同躋身世界前三。

在SenseCore的助力下,算法模型在快速生成和迭代的同時(shí),成本也在降低。

據(jù)商湯中報(bào)披露,基于大模型的自動(dòng)數(shù)據(jù)生產(chǎn)線不僅將數(shù)據(jù)自動(dòng)標(biāo)注速度提升到了傳統(tǒng)人工的600倍,成本也降到了過去人工的1/500,且標(biāo)注精度與人工水平一致。

通過SenseCore商湯AI大裝置強(qiáng)大的算力基礎(chǔ)和領(lǐng)先的算法能力,商湯能夠以高效、自動(dòng)化、集約化的方式,讓高質(zhì)量的AI算法實(shí)現(xiàn)“量產(chǎn)”,從而進(jìn)一步拓展AIGC的應(yīng)用范圍。

毋庸置疑,屬于元宇宙的黃金時(shí)代已經(jīng)初見端倪。

元宇宙未來已來

盡管《頭號(hào)玩家》那樣的元宇宙看起來離我們還很遙遠(yuǎn),但是元宇宙和我們生活的聯(lián)系遠(yuǎn)比我們想象的要緊密。

在廣州悅匯城周年慶的現(xiàn)場(chǎng),越秀地產(chǎn)聯(lián)合商湯推出AR Show,游客們可以看到冰龍?jiān)谏峡毡P旋,夢(mèng)幻逼真的冰雪城堡,還有從天而降的紅包雨等。

這無(wú)疑為顧客提供了一種全新的互動(dòng)方式,也重新定義了"商業(yè)空間"的概念。在悅匯城周年慶活動(dòng)期間,AR Show助力廣州悅匯城全場(chǎng)銷售額同比增長(zhǎng)196%,客流增長(zhǎng)超過開業(yè)同期。

一些我們熟悉的服務(wù)場(chǎng)景也在元宇宙的加持下發(fā)生了變化。寧波銀行上海分行就有一位特殊的大堂客服經(jīng)理——商湯科技基于"AI數(shù)字人服務(wù)中臺(tái)"為寧波銀行專屬打造的數(shù)字人員工小寧。

據(jù)了解,小寧不僅可以對(duì)前來辦理業(yè)務(wù)的顧客給予主動(dòng)問候和自動(dòng)接待,并通過專業(yè)、自然的交流互動(dòng),提供各類業(yè)務(wù)咨詢和問題回復(fù),還能針對(duì)客戶需求進(jìn)行自動(dòng)化引導(dǎo)和智能分流。

日前,小寧“首次亮相直播平臺(tái),這也是商湯科技AI數(shù)字人”虛擬IP在線上營(yíng)銷場(chǎng)景中的首次應(yīng)用。

事實(shí)上,元宇宙相關(guān)產(chǎn)業(yè)的商業(yè)化路徑正逐漸清晰,早早布局的商湯憑借先發(fā)優(yōu)勢(shì)顯露頭角。

在線上元宇宙方面,商湯已實(shí)現(xiàn)軟件向SaaS模式的升級(jí),連續(xù)6年實(shí)現(xiàn)市場(chǎng)份額增長(zhǎng),市場(chǎng)份額蟬聯(lián)第一。

商湯生產(chǎn)的交互式AI數(shù)字人,在文旅、展館、金融、教育、商超等實(shí)體產(chǎn)業(yè)中廣泛應(yīng)用。與此同時(shí),商湯在2022年與敦煌文創(chuàng)、徐悲鴻美術(shù)館等合作生成頂級(jí)IP數(shù)字文創(chuàng)產(chǎn)品,并發(fā)行超2萬(wàn)個(gè)限量版數(shù)字藏品。

商湯同步深度布局線下元宇宙場(chǎng)景,以簽約運(yùn)營(yíng)的商業(yè)模式,落地了百余個(gè)海內(nèi)外元宇宙項(xiàng)目,累計(jì)生成超過一千萬(wàn)平米線下場(chǎng)景。

僅商業(yè)零售元宇宙領(lǐng)域,商湯與中國(guó)電信合作賦能400多家商業(yè)綜合體。在北京富力廣場(chǎng)、上海虹口凱德mall、武漢萬(wàn)象城、鄭州正弘城,商湯的商業(yè)空間元宇宙應(yīng)用正在為線下商業(yè)帶來新的突破點(diǎn)和增長(zhǎng)點(diǎn)。

更直觀的表現(xiàn)則是,商湯2022年中報(bào)顯示,包含元宇宙業(yè)務(wù)的智慧生活板塊上半年?duì)I收同比增長(zhǎng)98%,占總收入的21%。

Gartner預(yù)測(cè)稱,到2026年,全球30%的企業(yè)機(jī)構(gòu)將擁有用于數(shù)字人和元宇宙的產(chǎn)品與服務(wù)。未來AIGC存在規(guī)模化變現(xiàn)的潛力。麥肯錫則預(yù)測(cè),到2030年全球元宇宙相關(guān)支出或達(dá)5萬(wàn)億美元。

在這場(chǎng)或許比移動(dòng)互聯(lián)網(wǎng)更加顛覆的大變革里,靠著布局和技術(shù)的領(lǐng)先身位,商湯有望迎來新的增長(zhǎng)曲線。

*文章封面首圖及配圖,版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無(wú)償使用,請(qǐng)及時(shí)聯(lián)系我們,本平臺(tái)將立即更正。

       原文標(biāo)題 : AIGC,喊出了元宇宙的“芝麻開門”

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)