可以跟女主拔萝卜的游戏,国产在线视精品在一区二区

AI浪潮如何賦能人形機器人？

2023-08-24 10:17

8月16日至21日，2023世界機器人大會在北京舉行。大會期間，北京市政府發(fā)布了《北京市機器人產(chǎn)業(yè)創(chuàng)新發(fā)展行動方案(2023—2025年)》，提出著眼世界前沿技術(shù)和未來戰(zhàn)略需求，加緊布局人形機器人，帶動醫(yī)療健康、協(xié)作、特種、物流四類優(yōu)勢機器人產(chǎn)品躍升發(fā)展。

機器人的應(yīng)用場景可謂極其廣泛，人形機器人自然也不例外，在小米集團(tuán)高級副總裁曾學(xué)忠的設(shè)想里，未來的智能制造體系中，70%的工作由自動化設(shè)備來完成；20%應(yīng)當(dāng)由仿真機器人來完成；剩下的10%需要人來完成。

今年以來，在AI浪潮的推動下，AI+人形機器人帶來的“具身智能”受到了市場關(guān)注。工業(yè)和信息化部副部長徐曉蘭表示，以人形機器人和通用人工智能為代表的新技術(shù)、新產(chǎn)品、新業(yè)態(tài)蓬勃發(fā)展，正成為全球科技創(chuàng)新的制高點。

人形機器人前景廣闊

機器人的發(fā)展跟隨制造業(yè)自動化程度不斷提升，從最早的單任務(wù)起重機式臂到機器人，再到能夠與人直接交互的協(xié)作機器人，再發(fā)展到與人工智能結(jié)合的人形機器人。

受全球勞動力缺口持續(xù)擴(kuò)大影響，人形機器人替代帶動巨大市場需求，東吳證券預(yù)計，在特斯拉人形機器人標(biāo)桿引領(lǐng)作用下，全球在2025年初步實現(xiàn)人形機器人商業(yè)化，實現(xiàn)銷量2萬-3萬臺。到2030年，新增需求100萬臺，2035年銷量有望突破1000萬臺。

隨著人形機器人技術(shù)的不斷發(fā)展和應(yīng)用場景的不斷拓展，市場規(guī)模有望不斷擴(kuò)大，其中，核心零部件方向是多家機構(gòu)預(yù)計受益的重點方向。具體而言，人形機器人身體核心零部件可以分為諧波減速器、行星滾柱絲杠、伺服電機三部分；手部核心零部件可以分為空心杯電機、微型行星齒輪箱兩部分。

結(jié)合2030年人形機器人需求數(shù)量，西南證券測算，五大核心零部件的市場空間于2030年市場規(guī)模如下：

1)諧波減速器：單臺機器人諧波減速器數(shù)量為14個，2030年單價有望降到600元，樂觀/中性/悲觀情景下市場空間分別為168/126/67億元；

2)行星滾柱絲杠：單臺機器人行星滾柱絲杠數(shù)量為14個，2030年單價有望降到2000元，樂觀/中性/悲觀情景下市場空間分別為560/420/224億元；

3)伺服電機：單臺機器人伺服電機數(shù)量28個，2030年單價有望降到300元，樂觀/中性/悲觀情景下市場空間分別為168/126/67億元。

4)空心杯電機：單臺機器空心杯電機數(shù)量為12個，2030年單價有望降到400元，樂觀/中性/悲觀情景下市場空間分別為96/72/38億元；

5)微型行星齒輪箱：單臺機器人行星滾柱絲杠數(shù)量為12個，2030年單價有望降到200元，樂觀/中性/悲觀情景下市場空間分別為48/36/19億元。

據(jù)國際機器人協(xié)會預(yù)測，2021年到2030年，全球人形機器人市場規(guī)模年復(fù)合增長率將高達(dá)71%。中國電子學(xué)會數(shù)據(jù)顯示，到2030年，我國人形機器人市場規(guī)模有望達(dá)到約8700億元。

AI如何賦能“具身智能”？

從產(chǎn)業(yè)角度考慮，人形機器人是AI和機器人兩大產(chǎn)業(yè)的共同發(fā)展方向，是技術(shù)、制造、服務(wù)三個核心能力的交匯點，也是軟硬件跟AI技術(shù)融合的制高點。目前，人形機器人的硬件主要包括五部分：

1)感知系統(tǒng)，相當(dāng)于機器人的“五官”，包括聲音、光、溫度、壓力、定位、接觸等傳感器，用以將外部環(huán)境信號轉(zhuǎn)換為機器人可以理解的信息或數(shù)據(jù)；2)驅(qū)動系統(tǒng)，相當(dāng)于機器人的“肌肉”，電機驅(qū)動包括電機、減速器、編碼器等；3)末端執(zhí)行系統(tǒng)，相當(dāng)于機器人的“手”，用以和外界環(huán)境進(jìn)行交互；4)能源供應(yīng)，電源或電池；5)運算系統(tǒng)及軟件，相當(dāng)于機器人的“大腦”。

各大科技巨頭紛紛推出AI大模型，有望解決人形機器人的通用性問題。AI大模型對人形機器人的賦能可以從語音、視覺、決策、控制等多方面實現(xiàn)，形成感知、決策、控制閉環(huán)，使機器人具備常識。國泰君安認(rèn)為，具體可以分為三個方向：

1)語音：語言大模型為機器人的自主語音交互難題提供了解決方案，在上下文理解、多語種識別、多輪對話、情緒識別、模糊語義識別等通用語言任務(wù)上，ChatGPT顯著優(yōu)于深度學(xué)習(xí)，表現(xiàn)出了不亞于人類的理解力和語言生成能力。

2)視覺：人形機器人的場景相對工業(yè)機器人更通用、更復(fù)雜，通用視覺大模型的All in One的多任務(wù)訓(xùn)練方案能使得機器人更好地適應(yīng)人類生活場景。大模型的強擬合能力使人形機器人在進(jìn)行目標(biāo)識別、避障、三維重建、語義分割等任務(wù)時，具備更高的精確度；通用視覺大模型通過大量數(shù)據(jù)學(xué)到更多的通用知識，并遷移到下游任務(wù)中，基于海量數(shù)據(jù)獲得的預(yù)訓(xùn)練模型具有較好的知識完備性，提升場景泛化效果。

3)決策：基于多模態(tài)的預(yù)訓(xùn)練大模型將增強機器人可完成任務(wù)的多樣性與通用性，讓其不局限于文本和圖像等單個部分，而是多應(yīng)用相容，拓展單一智能為融合智能，使機器人能結(jié)合其感知到的多模態(tài)數(shù)據(jù)實現(xiàn)自動化決策。

多個難題依舊待解

在AI浪潮下，2023年，人形機器人受到了不同以往的密集關(guān)注，商業(yè)化落地的大方向是有的，但目前，產(chǎn)業(yè)發(fā)展還面臨著諸多挑戰(zhàn)。

清華大學(xué)交叉信息研究院院長姚期智指出，目前人形機器人還面臨三個發(fā)展問題：首先，機器人還需要像大語言模型一樣擁有一個具身模型，一步到位做好最底層的控制；其次，在計算能力方面，即使是谷歌的Robotic Transformer模型，也只能達(dá)到3個赫茲水平，距離真正需要的500個赫茲還有很大差距；此外，機器人多模態(tài)的感官感知融合和數(shù)據(jù)收集方面，還有大量的挑戰(zhàn)和問題。

在AI部分，通用大模型本身并不是給通用人形機器人使用的，即使目前通用大模型已經(jīng)能很好地處理文本或者基本文字邏輯，但是它對環(huán)境的認(rèn)知和感知能力基本是零，無法認(rèn)知物理環(huán)境，也沒法抓取做操作，需要新的模型來訓(xùn)練。

除此之外，硬件性能與成本的平衡也是一大問題。

星動紀(jì)元創(chuàng)始人陳建宇表示，對硬件來說，行業(yè)希望機器人同時兼顧力量、速度、精度以及成本，但是目前所有技術(shù)都無法同時兼顧這幾項，例如液壓的技術(shù)速度和力量都很強，但是它成本太貴。

而高減速比諧波技術(shù)，可能精度比較高，但是靈巧性又降低；而新的轉(zhuǎn)制期技術(shù)雖然成本比較低，但是卻犧牲了載荷和精度，因此現(xiàn)在還沒有一個能夠兼顧所有達(dá)到滿意的情況。

至于“具身智能”真正落地的時間，陳建宇表示，當(dāng)前人形機器人、通用機器人還處于一個剛剛開始的階段，問題不會很快得以解決，這是比較長期的過程，可能是5-10年，也可能更長。

原文標(biāo)題 : AI浪潮如何賦能人形機器人？