AI數(shù)據(jù)進(jìn)入快車道,云測(cè)數(shù)據(jù)憑什么穩(wěn)居TOP1?
文 | 曾響鈴
來源 | 科技向令說
新基建驅(qū)動(dòng)AI加速落地,也讓它背后的“糧草”——AI數(shù)據(jù)標(biāo)注產(chǎn)業(yè)進(jìn)入發(fā)展快車道。
不久前,今年首場(chǎng)國家級(jí)重大國際經(jīng)貿(mào)活動(dòng)服貿(mào)會(huì)的成果發(fā)布環(huán)節(jié)上,數(shù)據(jù)標(biāo)注領(lǐng)域的頭部企業(yè)云測(cè)數(shù)據(jù)首次對(duì)外展示了一項(xiàng)成果,其數(shù)據(jù)項(xiàng)目的最高交付精準(zhǔn)度竟然達(dá)到了99.99%。
這個(gè)決定AI產(chǎn)品落地水平的領(lǐng)域里,99.99%的精準(zhǔn)度刷新了一個(gè)行業(yè)記錄,按照實(shí)際AI項(xiàng)目的需要,AI客戶可選擇的服務(wù)標(biāo)準(zhǔn)跨越到了一個(gè)新的時(shí)代。
事實(shí)上,在多元化的人工智能場(chǎng)景落地背景下,更高標(biāo)準(zhǔn)的AI數(shù)據(jù)質(zhì)量已成為AI的剛需。這次服貿(mào)會(huì)上,數(shù)據(jù)標(biāo)注的頭部企業(yè)所進(jìn)行的99.99%的成果展示,其背后也隱含著行業(yè)高階進(jìn)化的改變,最突出的就是“勞動(dòng)密集”的標(biāo)簽,可能要被徹底撕掉了。
高精度,成就數(shù)據(jù)標(biāo)注的“差異化”?
AI數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是人工智能鏈條上最偏“人工”的部分,早期的低門檻使得市面上存在著大大小小的企業(yè)、工作室,泥沙俱下,良莠不齊。
但現(xiàn)如今,我們已經(jīng)看到這一現(xiàn)狀正在發(fā)生變化,AI數(shù)據(jù)服務(wù)行業(yè)隨著AI產(chǎn)業(yè)需求進(jìn)行著優(yōu)勝劣汰。現(xiàn)在,當(dāng)行業(yè)頭部企業(yè)將最高項(xiàng)目交付精準(zhǔn)度提升到一個(gè)“頂尖”時(shí),馬太效應(yīng)突出,差異化趨勢(shì)愈發(fā)明顯。
1、表面同質(zhì)化服務(wù)下,數(shù)據(jù)精度推動(dòng)數(shù)據(jù)標(biāo)注企業(yè)獲得“差異化認(rèn)知”
在過去很長一段時(shí)間內(nèi),AI企業(yè)多根據(jù)自身項(xiàng)目需求為導(dǎo)向來選擇數(shù)據(jù)標(biāo)注服務(wù)商,AI數(shù)據(jù)行業(yè)內(nèi)并沒有太多嚴(yán)謹(jǐn)?shù)囊?guī)則。可以說,過去的數(shù)據(jù)標(biāo)注,是一個(gè)有些缺乏“差異化認(rèn)知”的行業(yè),A企業(yè)和B企業(yè)到底怎么區(qū)分,沒有明確的標(biāo)準(zhǔn)。
當(dāng)頭部企業(yè)從自身出發(fā)首次規(guī)范行業(yè)標(biāo)準(zhǔn),將最高99.99%的數(shù)據(jù)標(biāo)注精準(zhǔn)度進(jìn)行正式發(fā)布,實(shí)際上就等于給行業(yè)設(shè)定了一個(gè)可行的認(rèn)知標(biāo)準(zhǔn),這樣的AI數(shù)據(jù)才是高質(zhì)量數(shù)據(jù)。
至此,不管是AI企業(yè)客戶還是業(yè)界人士,或都可以借助精準(zhǔn)度對(duì)數(shù)據(jù)標(biāo)注行業(yè)進(jìn)行企業(yè)與企業(yè)的區(qū)分,而不是在認(rèn)知上一鍋燴。
而這,當(dāng)然也來源于99.99%這個(gè)精確度與其他諸如92%、95%、98%之類的數(shù)字存在著跨越時(shí)代級(jí)別的差異。
這某種程度上也表明數(shù)據(jù)標(biāo)注產(chǎn)業(yè)在伴隨AI發(fā)展多年后,自身開始趨向成熟,頭部玩家強(qiáng)者恒強(qiáng),產(chǎn)業(yè)內(nèi)優(yōu)勢(shì)資源和技術(shù)得到有效聚集,朝著無限接近100%進(jìn)發(fā),99.99%更像是一個(gè)里程碑,將加快人工智能時(shí)代的到來。
2、用高精度切中AI發(fā)展需求,數(shù)據(jù)標(biāo)注企業(yè)更容易獲得“差異化競(jìng)爭優(yōu)勢(shì)”
跳出普通人“認(rèn)知”方面的驅(qū)動(dòng)力,高精度數(shù)據(jù)的另一重差異化價(jià)值是切中AI發(fā)展需求。
隨著AI的持續(xù)深度發(fā)展,場(chǎng)景落地已經(jīng)代替技術(shù)研究成為主旋律,數(shù)據(jù)標(biāo)注的服務(wù)方向從“AI產(chǎn)品訓(xùn)練”走向“AI產(chǎn)品落地”,這意味著AI項(xiàng)目試錯(cuò)空間相較于技術(shù)研究大幅下降,要求更高的精確度來滿足用戶體驗(yàn)。
更進(jìn)一步看,新基建中的重要版塊AI新基建,生來就帶有強(qiáng)烈的落地應(yīng)用導(dǎo)向——要驅(qū)動(dòng)各大產(chǎn)業(yè)升級(jí),也必須更貼近落地。
在數(shù)據(jù)質(zhì)量決定AI算法的精度、算法的精度又決定產(chǎn)品質(zhì)量的關(guān)聯(lián)邏輯下,更注重落地的AI項(xiàng)目會(huì)更積極主動(dòng)尋找那些數(shù)據(jù)質(zhì)量(精確度)更高的供應(yīng)商,數(shù)據(jù)標(biāo)注行業(yè)將會(huì)形成過去沒有的梯度,發(fā)布最高99.99%精確度標(biāo)準(zhǔn)的頭部企業(yè)云測(cè)數(shù)據(jù),還將藉此獲得“差異化競(jìng)爭優(yōu)勢(shì)”吸引更多產(chǎn)業(yè)客戶,如果沒有更多企業(yè)跟隨上來,則將一直保持唯一的“第一梯隊(duì)”。
PK高精度后,是時(shí)候放棄對(duì)數(shù)據(jù)標(biāo)注“勞動(dòng)密集”偏見了?
勞動(dòng)密集是之前業(yè)界對(duì)AI數(shù)據(jù)標(biāo)注的主要評(píng)價(jià),或者說刻板印象,AI界的“富士康”之類的說法揭示出這個(gè)產(chǎn)業(yè)的外在尷尬形象。
但這一切,隨著更高精度的數(shù)據(jù)標(biāo)注成果出現(xiàn)而開始改變。
一個(gè)普通的草臺(tái)班子數(shù)據(jù)標(biāo)注團(tuán)隊(duì)可能也能實(shí)現(xiàn)及格線上的AI數(shù)據(jù)精確度,這是機(jī)械式的人力操作天然具備的能力,畢竟數(shù)據(jù)標(biāo)注確實(shí)主要靠的是人力的勞動(dòng)。但再要提升精度,尤其是無限往100%靠近,就必須更多依賴各種技能的支撐,不斷進(jìn)行高位再優(yōu)化,榨取精度提升的空間。
數(shù)據(jù)標(biāo)注的精準(zhǔn)度越高,再次上升(并保證配套服務(wù)質(zhì)量)能夠從“人力”中獲得的支持越少,從“技能”獲得的支持越多。
因此,當(dāng)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)出現(xiàn)99.99%這類高精度成果時(shí),也意味著技能的成分可能超越了人力的成分,行業(yè)已經(jīng)走向了各類前沿技術(shù)支撐的“技能密集”階段。
這種支撐高精確度的“技能密集”,應(yīng)當(dāng)包括四個(gè)方面:
1、專業(yè)人才技能:需求專業(yè)化倒逼數(shù)據(jù)標(biāo)注人才素養(yǎng)提升
專業(yè)、垂直類的數(shù)據(jù)標(biāo)注,比泛化的數(shù)據(jù)標(biāo)注更需要技能支撐,尤其在需要獲得高精準(zhǔn)度的情況下,單純的體力勞動(dòng)已經(jīng)不可能完成。
一是特殊的數(shù)據(jù)標(biāo)注類型,例如,云測(cè)數(shù)據(jù)的主要服務(wù)場(chǎng)景之一自動(dòng)駕駛,常常會(huì)有激光雷達(dá)傳感器產(chǎn)生的數(shù)據(jù)需要標(biāo)注。一般車載攝像頭的數(shù)據(jù)標(biāo)注,比較“體力化”,框出指定的元素教會(huì)算法識(shí)別即可:
而激光雷達(dá)的數(shù)據(jù)則與人類現(xiàn)實(shí)世界差距甚遠(yuǎn):
這時(shí)候,云測(cè)數(shù)據(jù)不得不要求人工對(duì)雷達(dá)數(shù)據(jù)有豐富的知識(shí)技能和處理經(jīng)驗(yàn),可能還牽扯很多物理學(xué)方面的知識(shí),絕不再是簡單地體力勞動(dòng)了。
二是,專業(yè)領(lǐng)域的數(shù)據(jù)標(biāo)注。這方面較為典型的是垂直領(lǐng)域的語音、文本類數(shù)據(jù)標(biāo)注,例如金融、家居領(lǐng)域,這些數(shù)據(jù)標(biāo)注的需求不亞于這些領(lǐng)域一線的業(yè)務(wù)人員(需要深度理解業(yè)務(wù),才能標(biāo)注好包括專業(yè)詞匯、邏輯等數(shù)據(jù)),因此,像云測(cè)數(shù)據(jù)這類平臺(tái)培養(yǎng)了金融、家居等領(lǐng)域的“專才”,甚至于,在為一些金融機(jī)構(gòu)服務(wù)時(shí),還要按照需求提供達(dá)到素質(zhì)要求的標(biāo)注隊(duì)伍進(jìn)行作業(yè)。
2、復(fù)雜工具技能:數(shù)據(jù)標(biāo)注本身也在進(jìn)行某種數(shù)字化升級(jí)
高精度的實(shí)現(xiàn),除了數(shù)據(jù)標(biāo)注人員由流水線工人轉(zhuǎn)化為有特定技能的專業(yè)人才之外,隨著業(yè)務(wù)量的擴(kuò)大,還配套有滲透全流程的各種數(shù)字化工具來提高準(zhǔn)確率、效率,這就如同一個(gè)制造業(yè)企業(yè)進(jìn)行了數(shù)字化、智能化升級(jí)來應(yīng)對(duì)嚴(yán)苛的市場(chǎng)競(jìng)爭一樣。
從云測(cè)數(shù)據(jù)的案例看,99.99%的準(zhǔn)確率背后是一大堆技術(shù)工具在支撐。
標(biāo)準(zhǔn)API接口的數(shù)據(jù)處理平臺(tái)支持各種主流格式,跟眾多AI企業(yè)可以做到短時(shí)間無縫銜接,省略線下做導(dǎo)入導(dǎo)出的繁瑣步驟。數(shù)據(jù)生產(chǎn)過程通過模板化的任務(wù)創(chuàng)建,數(shù)據(jù)采集,清洗到標(biāo)注全部線上流轉(zhuǎn),傳統(tǒng)線下流轉(zhuǎn)可能面臨的信息丟失、失真問題得到解決。
此外,云測(cè)數(shù)據(jù)引入了基于規(guī)則的機(jī)器篩查方式,在人工校驗(yàn)流程前根據(jù)所標(biāo)注內(nèi)容要求引入相關(guān)查錯(cuò)規(guī)則,這種數(shù)字化輔助直接提升了數(shù)據(jù)精度和效率。
事實(shí)上,強(qiáng)化工具能力一直是各數(shù)據(jù)標(biāo)注平臺(tái)在做的事,甚至AI本身的發(fā)展也反過來支撐數(shù)據(jù)標(biāo)注工作。云測(cè)數(shù)據(jù)這類扎根行業(yè)的企業(yè)這些年投入了大量資源在工具開發(fā)上,打個(gè)不恰當(dāng)?shù)谋确?這就好比富士康不斷增加工廠智能化水平、引入大量智能機(jī)械一樣,朝著“高端制造”前進(jìn)一樣。
3、綜合研發(fā)技能:“解決方案”輸出下的采集、標(biāo)注一體化
隨著AI技術(shù)深入到各個(gè)細(xì)分領(lǐng)域,企業(yè)對(duì)AI在商業(yè)化落地中的表現(xiàn)要求越來越高。在很多領(lǐng)域,客戶企業(yè)對(duì)服務(wù)供應(yīng)商會(huì)提出更多樣化的需求,這時(shí)候,“解決方案”式的合作方式不可能避免出現(xiàn)在數(shù)據(jù)標(biāo)注產(chǎn)業(yè)中,在拿出99.99%精準(zhǔn)度的同時(shí),云測(cè)數(shù)據(jù)還對(duì)外發(fā)布了智慧城市、智能家居、智能駕駛、智慧金融這四個(gè)場(chǎng)景的“全鏈條的AI訓(xùn)練數(shù)據(jù)服務(wù)方案”。
這些解決方案,簡單說,就是過去合作的拓寬、拓深,為了同樣保證超高精準(zhǔn)度,這個(gè)過程必然伴隨大量專業(yè)技術(shù)性的工作。
在數(shù)據(jù)標(biāo)注產(chǎn)業(yè)鏈上,采集與標(biāo)注不分家,華東、華北、華南設(shè)有數(shù)據(jù)交付中心和數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室的云測(cè)數(shù)據(jù),在給出的四個(gè)場(chǎng)景解決方案中,都十分強(qiáng)調(diào)場(chǎng)景化的數(shù)據(jù)采集服務(wù)。
例如,智慧城市數(shù)據(jù)解決方案的一個(gè)重要亮點(diǎn)或者說價(jià)值,是為客戶企業(yè)提供“長尾場(chǎng)景數(shù)據(jù)”——如不同光線下人員檢測(cè)、危險(xiǎn)動(dòng)作檢測(cè)等長尾情形,都需要不斷充實(shí)長尾場(chǎng)景,來提升“智慧”的覆蓋能力(處理、統(tǒng)計(jì)一些城市管理任務(wù))。
云測(cè)數(shù)據(jù)建立的“數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室”,通過還原場(chǎng)景、研究長尾場(chǎng)景的特點(diǎn)完成對(duì)應(yīng)傳感器下的場(chǎng)景數(shù)據(jù)采集工作,這種行為,本質(zhì)上相當(dāng)于數(shù)據(jù)標(biāo)注企業(yè)為智慧城市AI項(xiàng)目完成特定規(guī)則下的知識(shí)圖譜搭建。
類似的,還有智能家居場(chǎng)景中,在各類復(fù)雜語音背景下采集語音數(shù)據(jù),實(shí)驗(yàn)室開發(fā)底噪、混響、方言、語種等特殊要求下的數(shù)據(jù)采集;此外,在智能駕駛場(chǎng)景中,云測(cè)數(shù)據(jù)為了更加貼近真實(shí)場(chǎng)景,甚至通過改造轎車、標(biāo)定傳感器這種參照智能駕駛汽車行駛場(chǎng)景的方式來采集所需要的AI數(shù)據(jù)。
顯然,這些方式方法都遠(yuǎn)遠(yuǎn)超出了“勞動(dòng)密集”的范疇。
4、安全技能:被忽視的數(shù)據(jù)標(biāo)注“硬核”技術(shù)能力
AI越往深處走,數(shù)據(jù)資產(chǎn)的重要性就越高,尤其是AI數(shù)據(jù)更加立體和豐富、精準(zhǔn)度到達(dá)一個(gè)新的高度后,AI數(shù)據(jù)的價(jià)值變得更高,數(shù)據(jù)安全就更加成為客戶企業(yè)的剛需。
從數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的演變來看,對(duì)安全的重視,導(dǎo)致不少數(shù)據(jù)標(biāo)注企業(yè)至少在數(shù)據(jù)安全維護(hù)方面擁有可圈可點(diǎn)的技術(shù)耕耘,甚至不輸于其他被打上技術(shù)公司標(biāo)簽的巨頭。
一個(gè)現(xiàn)實(shí)是,像云測(cè)數(shù)據(jù)這樣的頭部企業(yè),即便擁有行業(yè)內(nèi)最專業(yè)的全職團(tuán)隊(duì),能夠保證高質(zhì)量數(shù)據(jù)也能夠?qū)崿F(xiàn)高效的作業(yè)效率,甚至不斷引導(dǎo)行業(yè)的規(guī)范化發(fā)展,這些地位、價(jià)值或者優(yōu)勢(shì),也都是建立在數(shù)據(jù)隱私安全的原則之上。
數(shù)據(jù)精準(zhǔn)度做得越高,云測(cè)數(shù)據(jù)這種企業(yè)就更看重?cái)?shù)據(jù)隱私安全的保護(hù)。這些年,除了流程和工作方式的嚴(yán)格控制,云測(cè)數(shù)據(jù)內(nèi)部還開發(fā)了數(shù)據(jù)隔離、質(zhì)量保障等一系列數(shù)據(jù)安全方面的技術(shù),這也使得數(shù)據(jù)標(biāo)注企業(yè)的“技術(shù)”標(biāo)簽更加濃厚。
Testin云測(cè)CMO張鵬飛也強(qiáng)調(diào),“從目前看來,AI數(shù)據(jù)行業(yè)關(guān)于安全、隱私等方面并沒有統(tǒng)一的標(biāo)準(zhǔn)。但從我們長遠(yuǎn)角度出發(fā),一直在隱私和安全防護(hù)角度下大力氣服務(wù)行業(yè)、樹立數(shù)據(jù)質(zhì)量標(biāo)桿,只有以這種負(fù)責(zé)的態(tài)度來服務(wù)客戶,我們的行業(yè)才能‘良幣驅(qū)除劣幣’,真正讓人工智能成為新一輪技術(shù)革命,改變整個(gè)社會(huì)和人類進(jìn)程”。
結(jié)語
99.99%的AI數(shù)據(jù)精準(zhǔn)度雖然是云測(cè)數(shù)據(jù)技術(shù)實(shí)力和服務(wù)能力積累的產(chǎn)物,但它也是行業(yè)發(fā)展到一定程度向更高階段躍遷的標(biāo)志。
更進(jìn)一步看,企業(yè)將精準(zhǔn)度推高到接近100%的動(dòng)作,本質(zhì)上也代表著數(shù)據(jù)標(biāo)注產(chǎn)業(yè)正在走出“勞動(dòng)密集”,轉(zhuǎn)入“技能密集”發(fā)展階段,這是與精準(zhǔn)度一樣重要的行業(yè)發(fā)展里程碑。數(shù)據(jù)標(biāo)注最終將撕掉舊有偏見下的標(biāo)簽,走入與AI同行的強(qiáng)技術(shù)服務(wù)產(chǎn)業(yè)行列。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 【一周車話】沒有方向盤和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無人駕駛車,還未迎來“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 6 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 7 馬斯克致敬“國產(chǎn)蘿卜”?
- 8 神經(jīng)網(wǎng)絡(luò),誰是盈利最強(qiáng)企業(yè)?
- 9 比蘋果偉大100倍!真正改寫人類歷史的智能產(chǎn)品降臨
- 10 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市