69精品人妻一区二区三区蜜桃,在线精品91麻豆国产在线观看

Sora刷屏！哪些A股上市公司或?qū)⑹芤妫?/p>

2024-02-18 09:05

《投資者網(wǎng)》葉芯

近日，OpenAI的文生視頻模型Sora刷屏了。

2月16日，OpenAI在其官網(wǎng)發(fā)布文生視頻模型Sora。據(jù)介紹，該模型可以生成長(zhǎng)達(dá)一分鐘的視頻，同時(shí)保持視覺(jué)品質(zhì)并遵循用戶提示。

作為OpenAI首推的文本轉(zhuǎn)視頻模型，Sora的問(wèn)世，宣告了新一輪科技革命的到來(lái)。Sora驚艷炸裂的效果，沖擊著當(dāng)前的AI行業(yè)。Sora橫空出世后，又將帶來(lái)怎樣的變革？資本市場(chǎng)哪些上市公司將受益？

Sora面世

Sora作為OpenAI首推的文本轉(zhuǎn)視頻模型，能夠嚴(yán)格根據(jù)用戶輸入的提示詞、文本指令或靜態(tài)圖像，生成長(zhǎng)達(dá)1分鐘的視頻，保持較高的視覺(jué)質(zhì)量，其中包含精細(xì)復(fù)雜的場(chǎng)景、生動(dòng)的角色表情以及復(fù)雜的鏡頭運(yùn)動(dòng)。同時(shí)也接受現(xiàn)有視頻擴(kuò)展或填補(bǔ)缺失的幀。

OpenAI表示，Sora能夠生成復(fù)雜的場(chǎng)景，不僅包括多個(gè)角色，還有特定的動(dòng)作類型，以及對(duì)對(duì)象和背景的準(zhǔn)確細(xì)節(jié)描繪。除此之外，Sora還可以將靜態(tài)圖像制作成動(dòng)畫(huà)。文本指令和靜態(tài)圖像均能生成準(zhǔn)確反映用戶提示的視頻。

國(guó)泰君安研報(bào)指出，Sora具有三大突出亮點(diǎn)，一是60秒長(zhǎng)視頻，Sora可以保持視頻主體與背景的高度流暢性與穩(wěn)定性。二是單視頻多角度鏡頭，Sora在一個(gè)視頻內(nèi)實(shí)現(xiàn)多角度鏡頭，分鏡切換符合邏輯且十分流暢。三是理解真實(shí)世界的能力，Sora對(duì)于光影反射、運(yùn)動(dòng)方式、鏡頭移動(dòng)等細(xì)節(jié)處理得十分優(yōu)秀，極大地提升了真實(shí)感。

與目前AI視頻賽道同行相比，Sora每條提示60秒的視頻長(zhǎng)度，遠(yuǎn)高于Pika Labs的3秒、Meta Emu Video的4秒和Runway公司Gen-2的18秒的視頻時(shí)長(zhǎng)。

此外，從官方發(fā)布的演示來(lái)看，無(wú)論從視頻流暢度還是細(xì)節(jié)表現(xiàn)能力上，Sora的效果都相當(dāng)驚艷。

不過(guò)，目前Sora仍在開(kāi)發(fā)中，OpenAI承認(rèn)該模型可能會(huì)混淆提示的空間細(xì)節(jié)，例如混淆左右，并且難以精確描述隨著時(shí)間推移發(fā)生的事件，例如遵循特定的相機(jī)軌跡。同時(shí)，OpenAI還稱，可擴(kuò)展的視頻生成模型，是構(gòu)建物理世界通用模擬器的一條可能的路徑。

Sora的面世，意味著AI視頻生成能力實(shí)現(xiàn)了跨越式發(fā)展。該模型可以深度模擬真實(shí)物理世界，標(biāo)志著人工智能在理解真實(shí)世界場(chǎng)景并與之互動(dòng)的能力方面實(shí)現(xiàn)了重大飛躍。

應(yīng)用前景廣闊

近年來(lái)，OpenAI領(lǐng)跑AI賽道。2021年初和2022年末，OpenAI分別推出了圖像生成系統(tǒng)DALL·E和聊天機(jī)器人ChatGPT。這也使得AI逐漸成為各行各業(yè)輔助工作的工具，也正逐漸改變?nèi)藗儗?duì)未來(lái)工作的看法。

如今，Sora模型能夠生成一分鐘的高保真視頻。視頻格式既可以是橫屏1920*1080視頻，豎屏1080*1920視頻，以及之間的所有內(nèi)容。這使得Sora可以兼容不同的視頻播放設(shè)備，根據(jù)特定的縱橫比來(lái)生成視頻內(nèi)容，這也會(huì)大大影響視頻創(chuàng)作領(lǐng)域，包括電影制作、電視內(nèi)容、自媒體等。

國(guó)盛證券認(rèn)為，文生視頻大模型Sora橫空出世，其能夠理解并呈現(xiàn)物理定律，影視動(dòng)畫(huà)行業(yè)的顛覆性時(shí)刻到來(lái)。

據(jù)介紹，Sora是基于過(guò)去對(duì)DALL·E和GPT的研究基礎(chǔ)構(gòu)建，利用DALL·E 3的重述提示詞技術(shù)，為視覺(jué)模型訓(xùn)練數(shù)據(jù)生成高描述性的標(biāo)注，因此模型能更好的遵循文本指令。

對(duì)此，360集團(tuán)創(chuàng)始人周鴻祎表示，Sora的技術(shù)思路完全不一樣。之前我們做視頻做圖用的都是Diffusion，是多個(gè)真實(shí)圖片的組合，這次OpenAI利用它的大語(yǔ)言模型優(yōu)勢(shì)，把LLM和Diffusion結(jié)合起來(lái)訓(xùn)練，讓Sora實(shí)現(xiàn)了對(duì)現(xiàn)實(shí)世界的理解和對(duì)世界的模擬兩層能力，這樣產(chǎn)生的視頻才是真實(shí)的，才能跳出2D的范圍模擬真實(shí)的物理世界。

“這都是大模型的功勞。OpenAI訓(xùn)練這個(gè)模型應(yīng)該會(huì)閱讀大量視頻。一幅圖勝過(guò)千言萬(wàn)語(yǔ)，而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過(guò)一幅圖，這就離AGI（通用人工智能）不遠(yuǎn)了，不是10年20年的問(wèn)題，可能一兩年很快就可以實(shí)現(xiàn)。”周鴻祎稱。

周鴻祎表示，這也代表未來(lái)的方向。有強(qiáng)勁的大模型做底子，基于對(duì)人類語(yǔ)言的理解，對(duì)人類知識(shí)和世界模型的了解，再疊加很多其他的技術(shù)，就可以創(chuàng)造各個(gè)領(lǐng)域的超級(jí)工具，比如生物醫(yī)學(xué)、蛋白質(zhì)和基因研究，包括物理、化學(xué)、數(shù)學(xué)的學(xué)科研究上，大模型都會(huì)發(fā)揮作用。這次Sora對(duì)物理世界的模擬，至少將會(huì)對(duì)機(jī)器人具身智能和自動(dòng)駕駛帶來(lái)巨大的影響。

國(guó)盛證券也持有相同的觀點(diǎn)。其認(rèn)為文生視頻大模型Sora橫空出世，其能夠理解并呈現(xiàn)物理定律，影視動(dòng)畫(huà)行業(yè)的顛覆性時(shí)刻到來(lái)。

對(duì)于Sora的面世，工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員、數(shù)字經(jīng)濟(jì)專家劉興亮稱，這標(biāo)志著AI技術(shù)在內(nèi)容創(chuàng)作領(lǐng)域的一個(gè)新紀(jì)元。

“Sora能夠生成持續(xù)一分鐘左右的1080P高清視頻，涵蓋多個(gè)角色、不同類型的動(dòng)作和背景細(xì)節(jié)等，幾乎達(dá)到了電影級(jí)別的逼真場(chǎng)景。這種能力不僅為內(nèi)容創(chuàng)作者提供了前所未有的工具，使他們能夠以更低的成本和更快的速度將創(chuàng)意變?yōu)楝F(xiàn)實(shí)，而且為觀眾帶來(lái)了更豐富和多樣化的視覺(jué)體驗(yàn)。技術(shù)創(chuàng)新的這一巨大飛躍，預(yù)示著AI在未來(lái)人類生活的各個(gè)方面都將發(fā)揮更加重要的作用。”劉興亮表示。

AI基礎(chǔ)設(shè)施需求旺盛

市場(chǎng)觀點(diǎn)認(rèn)為，2022年是影像之年，2023是聲波之年，而2024是視頻之年。

OpenAI表示，Sora是構(gòu)建世界模型的基礎(chǔ)，未來(lái)將向?qū)崿F(xiàn)AGI繼續(xù)邁進(jìn)。

對(duì)于Sora的發(fā)展，算力需求旺盛。國(guó)泰君安指出，Sora模型推動(dòng)AI多模態(tài)領(lǐng)域飛躍式發(fā)展，AI創(chuàng)作等相關(guān)領(lǐng)域?qū)⒂瓉?lái)深度變革，AI賦能范圍進(jìn)一步擴(kuò)大，多模態(tài)相關(guān)的訓(xùn)練及推理應(yīng)用也將進(jìn)一步提升對(duì)算力基礎(chǔ)設(shè)施的相關(guān)需求。

無(wú)獨(dú)有偶，國(guó)盛證券也持有相同的觀點(diǎn)，其認(rèn)為，Sora依舊符合AI縮尺律（Scaling Law）OpenAI在技術(shù)文檔中說(shuō)明，隨著訓(xùn)練計(jì)算量的增加，樣本質(zhì)量明顯提高，進(jìn)一步佐證了多模態(tài)時(shí)代，算力需求將成為最核心的瓶頸之一。

多模態(tài)大模型拉動(dòng)全球算力需求快速增長(zhǎng)，國(guó)產(chǎn)AI算力迎來(lái)機(jī)會(huì)。根據(jù)南方財(cái)富網(wǎng)趨勢(shì)選股系統(tǒng)數(shù)據(jù)統(tǒng)計(jì)，A股國(guó)產(chǎn)AI算力相關(guān)上市企業(yè)目前數(shù)量有52家，如國(guó)產(chǎn)AI算力產(chǎn)業(yè)鏈包含AI服務(wù)器零部件、服務(wù)器整機(jī)、算力租賃、數(shù)據(jù)中心等環(huán)節(jié)。AI服務(wù)器零部件公司主要包括海光信息、寒武紀(jì)、龍芯中科、景嘉微等；服務(wù)器整機(jī)公司主要包括高新發(fā)展、神州數(shù)碼、拓維信息、廣電運(yùn)通、烽火通信、同方股份等；算力租賃公司主要包括恒潤(rùn)股份、云賽智聯(lián)、鴻博股份等；數(shù)據(jù)中心公司主要包括奧飛數(shù)據(jù)、光環(huán)新網(wǎng)、寶信軟件、數(shù)據(jù)港等。

此外，多家巨頭謀劃布局AI基礎(chǔ)設(shè)施。舉例來(lái)看，主營(yíng)視頻創(chuàng)意、繪圖創(chuàng)意類軟件產(chǎn)品的萬(wàn)興科技近日在互動(dòng)平臺(tái)表示，公司旗下視頻創(chuàng)意產(chǎn)品萬(wàn)興喵影/Filmora可用于各類視頻的創(chuàng)作和剪輯，“天幕”大模型是以視頻創(chuàng)意類AI技術(shù)為核心的多媒體大模型，涵蓋音頻、圖像、視頻等多模態(tài)能力。

昆侖萬(wàn)維旗下Star Group和Opera都具備做短視頻的土壤，其中Opera在海外已經(jīng)推出了短視頻功能。此外，昆侖萬(wàn)維天工大模型在騰訊優(yōu)圖實(shí)驗(yàn)室聯(lián)合廈門大學(xué)開(kāi)展的多模態(tài)大語(yǔ)言模型測(cè)評(píng)中，綜合得分排名第一。

專業(yè)智能視頻解決方案與視頻云服務(wù)提供商當(dāng)虹科技擁有自研的AIGC工具集，于去年上半年發(fā)布以靜態(tài)照片生成三維體積視頻的方案。

當(dāng)虹科技1月5日互動(dòng)平臺(tái)表示，公司擁有自研的AIGC工具集，發(fā)布了以靜態(tài)照片生成三維體積視頻的方案，并且通過(guò)點(diǎn)云模型轉(zhuǎn)換及壓縮算法實(shí)現(xiàn)高達(dá)800倍的視覺(jué)無(wú)損壓縮，實(shí)現(xiàn)不同模態(tài)之間相互切換。

因賽集團(tuán)旗下InsightGPT目前可生成20秒以上的視頻，能夠結(jié)合圖像、視頻大模型，融合摳圖等多種算法，再結(jié)合音頻模型，整體渲染后最終合成完整視頻。

據(jù)不完全統(tǒng)計(jì)，包括萬(wàn)興科技、博匯科技、易點(diǎn)天下、數(shù)碼視訊、漢王科技、當(dāng)虹科技、東方國(guó)信、神思電子、因賽集團(tuán)、拓爾思、國(guó)脈文化、佳都科技在內(nèi)的超10家A股上市公司近三個(gè)月以來(lái)在互動(dòng)平臺(tái)披露視頻生成模型領(lǐng)域的業(yè)務(wù)情況。（思維財(cái)經(jīng)出品）■

來(lái)源：投資者網(wǎng)

原文標(biāo)題 : Sora刷屏！哪些A股上市公司或?qū)⑹芤妫?/span>