肉大捧一进一出免费视频,国产精品无码第9页,夜色精品亚洲网站在线观看

AIGC，喊出了元宇宙的“芝麻開門”

2023-01-16 09:04

來源｜伯虎財(cái)經(jīng)（bohuFN）

作者｜陳平安

2022年8月，在美國(guó)科羅拉多州博覽會(huì)上，一幅名為《太空歌劇院》的繪畫作品贏得了數(shù)字類別的一等獎(jiǎng)，但不少人對(duì)于這個(gè)獎(jiǎng)項(xiàng)的授予并不服氣。

爭(zhēng)議并不源自作品的質(zhì)量，而是這幅作品并不完全由畫師個(gè)人完成。游戲設(shè)計(jì)師Jason Allen首先是通過AI繪圖工具M(jìn)idjourney生成原畫，再經(jīng)過Photoshop潤(rùn)色，從而完成了這幅作品。

這并非AIGC（人工智能內(nèi)容生成）發(fā)展的孤例。就在月前，互聯(lián)網(wǎng)刮起了一陣ChatGPT風(fēng)，起因是OpenAI發(fā)布了一個(gè)全新的聊天機(jī)器人模型—— ChatGPT。和過去那些聊天機(jī)器人相比，ChatGPT不僅可以回答人類的追問，承認(rèn)自己回答中的錯(cuò)誤，拒絕回答不適當(dāng)?shù)膯栴}，還能寫詩(shī)和編程。根據(jù)外媒報(bào)道，有人甚至讓ChatGPT為自己寫論文并獲得了及格。

連馬斯克都忍不住感嘆：“ChatGPT好得嚇人，我們離強(qiáng)大到危險(xiǎn)的人工智能不遠(yuǎn)了。＂

當(dāng)藝術(shù)界開始因?yàn)椤癆I繪畫到底算不算藝術(shù)品”而吵得不可開交，當(dāng)普羅大眾對(duì)ChatGPT的對(duì)話能力驚嘆不已，AIGC本身值得期待的就不再只是驚人的迭代和學(xué)習(xí)能力，而是作為一個(gè)生產(chǎn)力和生產(chǎn)工具的結(jié)合體，在生成內(nèi)容維度和智能化程度上所展現(xiàn)的潛力。

破解元宇宙內(nèi)容難題

一個(gè)公認(rèn)的事實(shí)是，制約元宇宙相關(guān)產(chǎn)業(yè)發(fā)展的重要瓶頸，是內(nèi)容生產(chǎn)上的不足。也許你會(huì)馬上反駁，最大的障礙難道不是技術(shù)的不成熟嗎？確實(shí)，當(dāng)下無(wú)論是VR還是AR，交互技術(shù)和光學(xué)技術(shù)都無(wú)法達(dá)到大多數(shù)人對(duì)元宇宙期望的那樣。

但元宇宙相關(guān)產(chǎn)業(yè)的落地和發(fā)展并不完全依賴于這些硬件，無(wú)論是數(shù)字人還是元宇宙第一股Roblox都足以證明。

元宇宙當(dāng)前最大的挑戰(zhàn)反而是在內(nèi)容側(cè)，如何提供能夠滿足各行各業(yè)需求的高質(zhì)量?jī)?nèi)容？

以數(shù)字人為例，＂擬人化＂和＂自動(dòng)化＂是判斷一個(gè)數(shù)字人等級(jí)的標(biāo)準(zhǔn)。在這個(gè)標(biāo)準(zhǔn)下，數(shù)字人被分為了L1－L5五個(gè)等級(jí)。其中L4級(jí)別的數(shù)字人能夠?qū)崿F(xiàn)部分智能化交互；L5級(jí)則能夠?qū)崿F(xiàn)完全智能化交互。從L4級(jí)別開始，數(shù)字人能夠逐漸替代真人去完成服務(wù)。

（來源：商湯智能產(chǎn)業(yè)研究院）

這也意味著，數(shù)字人產(chǎn)業(yè)的突破，和L4及以上級(jí)別的數(shù)字人能否量產(chǎn)息息相關(guān)。但一般一個(gè)數(shù)字人的生成需要經(jīng)過模型重建、動(dòng)畫準(zhǔn)備等多個(gè)過程，制作流程長(zhǎng)達(dá)數(shù)月，這種生產(chǎn)力上的不足也嚴(yán)重制約了數(shù)字人的普及。

AIGC正在成為打破這道瓶頸的關(guān)鍵。

從2016年創(chuàng)造SenseMARS平臺(tái)時(shí)，AI龍頭商湯科技就開始從全景智能的角度布局AIGC各種能力。

到目前為止，商湯不僅在計(jì)算機(jī)視覺方面積累了超過49000個(gè)算法模型，覆蓋從視覺信號(hào)的分析理解到實(shí)現(xiàn)數(shù)字內(nèi)容的生成等各方面；也自研并具備了包括語(yǔ)音識(shí)別（ASR）、語(yǔ)義理解（NLP知識(shí)圖譜）、語(yǔ)音合成（TTS）以及語(yǔ)音動(dòng)畫合成（STA）等多項(xiàng)技術(shù)能力。

通過這些底層AI技術(shù)的迭代，商湯幾乎重塑了數(shù)字人的整個(gè)生產(chǎn)流程。

（來源：商湯智能產(chǎn)業(yè)研究院）

在傳統(tǒng) CG 建模環(huán)節(jié)里，商湯推出的智能化生成引擎可以基于少量照片的面部掃描，算法自動(dòng)生成高精度的3D 面部模型，大大減少了建模環(huán)節(jié)的投入和時(shí)間成本。

智能化驅(qū)動(dòng)引擎則通過STA等算法加速協(xié)調(diào)數(shù)字人的擬人化程度，讓其整體動(dòng)作表現(xiàn)更加自然，減輕了畫師的工作強(qiáng)度和人工成本。

而在決定數(shù)字人＂自動(dòng)化＂的多模態(tài)交互和深度學(xué)習(xí)能力構(gòu)建環(huán)節(jié)，智能化交互引擎專注于提高數(shù)字人的智慧性�；谡Z(yǔ)音識(shí)別（ASR）、語(yǔ)音合成（TTS）、自然語(yǔ)言理解（NLP）等技術(shù)組合，結(jié)合商湯所積累的海量特定知識(shí)領(lǐng)域的知識(shí)問答庫(kù)，數(shù)字人不僅可以和用戶快速高效的建立對(duì)話關(guān)系，還能實(shí)現(xiàn)自身的深度學(xué)習(xí)和迭代升級(jí)。

同樣的例子在游戲產(chǎn)業(yè)也有所體現(xiàn)。

游戲是業(yè)內(nèi)公認(rèn)的元宇宙雛形之一，但當(dāng)下游戲產(chǎn)業(yè)發(fā)展的桎梏也很明顯，即內(nèi)容創(chuàng)新。傳統(tǒng)開發(fā)存在明顯的智能上限，這使得游戲很難持續(xù)為玩家提供情緒價(jià)值。在此條件下，游戲廠商們要么持續(xù)投入大量資金做內(nèi)容建設(shè)，要么等待下一個(gè)天才策劃或者玩法的出現(xiàn)。

也因此，能夠快速、高質(zhì)量產(chǎn)出內(nèi)容的AIGC被視為了破局的關(guān)鍵。2021年商湯成立了智慧決策與游戲事業(yè)部，推出了SenseMAP。這款集合了商湯深度學(xué)習(xí)、智慧決策等前沿的AI技術(shù)的產(chǎn)品幾乎涵蓋了游戲開發(fā)的整個(gè)流程。

在游戲生態(tài)上，SenseMAP不僅能夠通過真實(shí)玩家游戲數(shù)據(jù)訓(xùn)練NPC，讓其具備類似真實(shí)玩家的游戲行為，還能讓其和普通玩家進(jìn)行互動(dòng)。

在內(nèi)容生態(tài)上，SenseMAP支持角色設(shè)計(jì)、動(dòng)作捕捉、人臉3D生成等多項(xiàng)功能，大大降低了角色的生產(chǎn)周期，滿足玩家的UGC需求。

隨著AIGC的發(fā)展和普及，過去那些耗費(fèi)巨大的知識(shí)性和創(chuàng)造性工作的邊際成本將大幅降低，過去制約元宇宙相關(guān)產(chǎn)業(yè)發(fā)展的內(nèi)容問題將迎刃而解，從而產(chǎn)生巨大的生產(chǎn)效率和經(jīng)濟(jì)價(jià)值。

可以預(yù)見的是，AIGC正站在元宇宙的石門前，喊出了那聲“芝麻開門”。

AIGC何以被點(diǎn)燃？

AIGC的本質(zhì)是內(nèi)容與場(chǎng)景，需要AI與后端基建，也就是算法、數(shù)據(jù)和算力共同生成。當(dāng)下，AIGC正朝著更強(qiáng)、更快、更低成本的方向發(fā)展。

一方面，隨著AI模型的通用性不斷提高，AIGC應(yīng)用的門檻在降低，效率卻在進(jìn)一步提高。

2015年以前，小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因?yàn)樾⌒偷哪Ｐ蛯?duì)于硬件的要求較低，同時(shí)和大模型相比，小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點(diǎn)在于，對(duì)通用任務(wù)的處理表現(xiàn)并不好。換言之，他們很難針對(duì)特定領(lǐng)域或者場(chǎng)景去進(jìn)行定制。

在這個(gè)背景下，大模型脫穎而出。大模型可泛化能力強(qiáng)，可以做到＂舉一反三＂，同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個(gè)場(chǎng)景的任務(wù)，從而擺脫小模型應(yīng)用碎片化、作坊式開發(fā)的特點(diǎn)。

這為AIGC進(jìn)入新階段提供了契機(jī)。以商湯為例，剖析其技術(shù)基座，商湯元宇宙主要基于SenseMARS火星混合現(xiàn)實(shí)平臺(tái)打造，目前該平臺(tái)內(nèi)含3，500個(gè)人工智能模型，包括感知智能、決策智能、智能內(nèi)容生成（包括增強(qiáng)現(xiàn)實(shí)、混合現(xiàn)實(shí)）、軟件智能體及其他基礎(chǔ)設(shè)施（如云引擎等）。

基于SenseMARS，商湯能夠針對(duì)不同的行業(yè)拿出的方案，從而實(shí)現(xiàn)元宇宙相關(guān)產(chǎn)業(yè)的廣泛應(yīng)用。前文提到的數(shù)字人就是典型案例。商湯打造的AI數(shù)字人不僅在逼真程度上媲美真人，而且更聰明，能夠＂聽得懂，看得見，說得出＂，很重要的原因在于商湯的AI數(shù)字人是由三種引擎（算法）共同打造的。

另一方面，算力、算法模型等后端基建相關(guān)的基礎(chǔ)設(shè)施建設(shè)加速了大模型的生產(chǎn)迭代，這為AIGC的廣泛應(yīng)用打下了基礎(chǔ)。

爆火的ChatGPT能夠?qū)崿F(xiàn)當(dāng)前的交互，就離不開OpenAI在AI預(yù)訓(xùn)練大模型領(lǐng)域的積累。從2018年起，OpenAI就開始發(fā)布生成式預(yù)訓(xùn)練語(yǔ)言模型GPT，可用于生成文章、代碼、機(jī)器翻譯、問答等各類內(nèi)容。

在這股預(yù)訓(xùn)練大模型的風(fēng)潮之下，是一場(chǎng)拼參數(shù)、拼算力的軍備競(jìng)賽。2018年，GPT的參數(shù)量還只有1．17億。隨后幾年，OpenAI每一代GPT模型的參數(shù)量都爆炸式增長(zhǎng)。到2020年5月，新發(fā)布的GPT－3參數(shù)量直接暴漲至1750億。

AI模型對(duì)算力的需求在過去短短幾年內(nèi)翻了大約100萬(wàn)倍，平均每年十幾倍，這個(gè)增速甚至超過了對(duì)算法精度增長(zhǎng)的需求。

算力即最核心的生產(chǎn)力。如何把握住驅(qū)動(dòng)AIGC的根本源動(dòng)力？商湯的人工智能基礎(chǔ)設(shè)施SenseCore AI大裝置在更早時(shí)候已給出了答案。

資料顯示，SenseCore商湯AI大裝置的核心由計(jì)算基礎(chǔ)設(shè)施、模型層、深度學(xué)習(xí)層三個(gè)部分架構(gòu)而成，分別對(duì)應(yīng)算力、算法模型生成和算法模型訓(xùn)練三個(gè)要素。

2022年，商湯在上海臨港的智算中心AIDC正式運(yùn)營(yíng)，是亞洲最大的人工智能智能計(jì)算中心之一。得益于磅礴算力的加持，模型層中的商湯的SenseSpring“模型工廠”能夠快速生成穩(wěn)定可靠的模型，截至2022年6月，累計(jì)生產(chǎn)近50000個(gè)商用人工智能模型。

ChatGPT本質(zhì)上是基于NLP大模型落地的應(yīng)用。而基于SenseCore，在視覺大模型領(lǐng)域，商湯已訓(xùn)練和構(gòu)建了超過300億量級(jí)模型參數(shù)超大基模型，得以有效支持AIGC的應(yīng)用。

商湯2022年中報(bào)透露，公司在ImageNet大規(guī)模識(shí)別任務(wù)中實(shí)現(xiàn)超90％精度，和Google、微軟共同躋身世界前三。

在SenseCore的助力下，算法模型在快速生成和迭代的同時(shí)，成本也在降低。

據(jù)商湯中報(bào)披露，基于大模型的自動(dòng)數(shù)據(jù)生產(chǎn)線不僅將數(shù)據(jù)自動(dòng)標(biāo)注速度提升到了傳統(tǒng)人工的600倍，成本也降到了過去人工的1／500，且標(biāo)注精度與人工水平一致。

通過SenseCore商湯AI大裝置強(qiáng)大的算力基礎(chǔ)和領(lǐng)先的算法能力，商湯能夠以高效、自動(dòng)化、集約化的方式，讓高質(zhì)量的AI算法實(shí)現(xiàn)“量產(chǎn)”，從而進(jìn)一步拓展AIGC的應(yīng)用范圍。

毋庸置疑，屬于元宇宙的黃金時(shí)代已經(jīng)初見端倪。

元宇宙未來已來

盡管《頭號(hào)玩家》那樣的元宇宙看起來離我們還很遙遠(yuǎn)，但是元宇宙和我們生活的聯(lián)系遠(yuǎn)比我們想象的要緊密。

在廣州悅匯城周年慶的現(xiàn)場(chǎng)，越秀地產(chǎn)聯(lián)合商湯推出AR Show，游客們可以看到冰龍?jiān)谏峡毡P旋，夢(mèng)幻逼真的冰雪城堡，還有從天而降的紅包雨等。

這無(wú)疑為顧客提供了一種全新的互動(dòng)方式，也重新定義了＂商業(yè)空間＂的概念。在悅匯城周年慶活動(dòng)期間，AR Show助力廣州悅匯城全場(chǎng)銷售額同比增長(zhǎng)196％，客流增長(zhǎng)超過開業(yè)同期。

一些我們熟悉的服務(wù)場(chǎng)景也在元宇宙的加持下發(fā)生了變化。寧波銀行上海分行就有一位特殊的大堂客服經(jīng)理——商湯科技基于＂AI數(shù)字人服務(wù)中臺(tái)＂為寧波銀行專屬打造的數(shù)字人員工小寧。

據(jù)了解，小寧不僅可以對(duì)前來辦理業(yè)務(wù)的顧客給予主動(dòng)問候和自動(dòng)接待，并通過專業(yè)、自然的交流互動(dòng)，提供各類業(yè)務(wù)咨詢和問題回復(fù)，還能針對(duì)客戶需求進(jìn)行自動(dòng)化引導(dǎo)和智能分流。

日前，小寧“首次亮相直播平臺(tái)，這也是商湯科技AI數(shù)字人”虛擬IP在線上營(yíng)銷場(chǎng)景中的首次應(yīng)用。

事實(shí)上，元宇宙相關(guān)產(chǎn)業(yè)的商業(yè)化路徑正逐漸清晰，早早布局的商湯憑借先發(fā)優(yōu)勢(shì)顯露頭角。

在線上元宇宙方面，商湯已實(shí)現(xiàn)軟件向SaaS模式的升級(jí)，連續(xù)6年實(shí)現(xiàn)市場(chǎng)份額增長(zhǎng)，市場(chǎng)份額蟬聯(lián)第一。

商湯生產(chǎn)的交互式AI數(shù)字人，在文旅、展館、金融、教育、商超等實(shí)體產(chǎn)業(yè)中廣泛應(yīng)用。與此同時(shí)，商湯在2022年與敦煌文創(chuàng)、徐悲鴻美術(shù)館等合作生成頂級(jí)IP數(shù)字文創(chuàng)產(chǎn)品，并發(fā)行超2萬(wàn)個(gè)限量版數(shù)字藏品。

商湯同步深度布局線下元宇宙場(chǎng)景，以簽約運(yùn)營(yíng)的商業(yè)模式，落地了百余個(gè)海內(nèi)外元宇宙項(xiàng)目，累計(jì)生成超過一千萬(wàn)平米線下場(chǎng)景。

僅商業(yè)零售元宇宙領(lǐng)域，商湯與中國(guó)電信合作賦能400多家商業(yè)綜合體。在北京富力廣場(chǎng)、上海虹口凱德mall、武漢萬(wàn)象城、鄭州正弘城，商湯的商業(yè)空間元宇宙應(yīng)用正在為線下商業(yè)帶來新的突破點(diǎn)和增長(zhǎng)點(diǎn)。

更直觀的表現(xiàn)則是，商湯2022年中報(bào)顯示，包含元宇宙業(yè)務(wù)的智慧生活板塊上半年?duì)I收同比增長(zhǎng)98％，占總收入的21％。

Gartner預(yù)測(cè)稱，到2026年，全球30％的企業(yè)機(jī)構(gòu)將擁有用于數(shù)字人和元宇宙的產(chǎn)品與服務(wù)。未來AIGC存在規(guī)模化變現(xiàn)的潛力。麥肯錫則預(yù)測(cè)，到2030年全球元宇宙相關(guān)支出或達(dá)5萬(wàn)億美元。

在這場(chǎng)或許比移動(dòng)互聯(lián)網(wǎng)更加顛覆的大變革里，靠著布局和技術(shù)的領(lǐng)先身位，商湯有望迎來新的增長(zhǎng)曲線。

＊文章封面首圖及配圖，版權(quán)歸版權(quán)所有人所有。若版權(quán)者認(rèn)為其作品不宜供大家瀏覽或不應(yīng)無(wú)償使用，請(qǐng)及時(shí)聯(lián)系我們，本平臺(tái)將立即更正。

原文標(biāo)題 : AIGC，喊出了元宇宙的“芝麻開門”