訂閱
糾錯
加入自媒體

讓AI掀開視障人士眼前的簾子

2018-05-29 10:37
智能相對論
關注

讓AI掀開視障人士眼前的簾子

在臺灣,有一位歌手叫蕭煌奇,他因先天性白內障一出生就全盲,在4歲動了眼部手術后成為弱視。15歲那年,蕭煌奇在重見光明多年后再度失明,但是他一直保持樂觀態(tài)度,熱愛音樂與創(chuàng)作,一首以自己為原型的《你是我的眼》橫空出世,給所有黑暗中的視障人士帶來了鼓勵與溫暖。

“你是我的眼,帶我領略四季的變化”,當AI要承擔起“眼睛”這個角色時,是否能將這個世界帶到視障人士的面前呢?又是否切合了視障人士的真正需求呢?

從感知到“看見“:層出不窮的“助視”產品

不得不說,巨頭們在推進前沿技術的同時,一直沒有忘記對視障這一弱勢群體的關懷。一大批助力視障患者的產品和技術如雨后春筍般涌現(xiàn)。微軟繼前年在主題演講會中講述了人工智能和智能眼鏡幫助盲人“看到”世界后,今年又一次提及了人工智能幫助盲人學生跨越交流障礙,這些科技里流露的溫情不僅體現(xiàn)了企業(yè)對視障群體的關懷,也是對科技巨頭最好的品牌廣告。

智能相對論分析師顏璇梳理了各類與視障有關的智能產品,大致將其分為三種類型:

1.曲線救國型:一般來說,目不能視的視障患者認知外界世界的渠道是除了視覺之外的其它感官感覺,比如聽覺、嗅覺和觸覺。比如海倫·凱勒的老師在教她認“water”時,讓她伸出一只手去感知水的流動,并在海倫的另一只手上拼寫了這個單詞。

基于此,慕尼黑公司和韓國公司聯(lián)合完成了一款專供盲人使用的盲文智能手表(Dot Watch),搭載了盲文顯示系統(tǒng),以盲文的形式將各種信息呈現(xiàn)在手表的觸摸表盤里。

相機也給出了觸摸形式。美國一位設計師專門為視障人士設計了一款to see 3D相機,這款相機能通過鏡頭實時地將拍攝的物體轉化成三維觸感數(shù)據(jù),使視障人士通過觸摸屏幕表面生成的立體形狀來識別面部細節(jié),比如讀取表情等。

讓AI掀開視障人士眼前的簾子

當然了,除了觸覺,聽覺的也不會少。IBM 推出了無障礙環(huán)境的一項發(fā)明——專為盲人設計的新型導航 APP NavCog。NavCog 可通過耳機與智障人士“耳語”,幫助人實時識別位置、朝向,還能辨認迎面走來的熟人。

讓AI掀開視障人士眼前的簾子

2.外力加持型:視障人士通常分為兩種,一種是全失明,指完全失去視力,另一種為弱視,即視力不到常人的60%,在視障人士當中,弱視群體占到近 70% 的比例。面對這類群體,為他們做一個智能眼鏡就很有必要了。

比如一款名為eSight的產品,結合算法和部分盲人自身的需要,通過控制器中的液體鏡頭技術進行“聚焦”,弱視者可以利用眼鏡中的 Bioptic 傾斜功能,不僅可以調整瞳孔距離(對焦),還可以調整圖像的清晰度(顏色、對比度、亮度),從而“重獲光明”。

讓AI掀開視障人士眼前的簾子

3.直截了當型:視覺的產生依賴于三大組織器官:眼球(主要為視網膜)、視神經、視皮層。對于視障患者而言,如果想要“一了百了”,恢復視覺,就必須研發(fā)出能替代這三種組織的假體,即視網膜假體、視神經假體和視皮層假體。

國內就有研究團隊制作出了人造視網膜,其由體內電子微系統(tǒng)和體外電子系統(tǒng)兩部分組成。使用方法是在患者眼球內部植入IC芯片,用來接收信息和傳導電信號。然后再為盲人配備一個體外接收系統(tǒng),比如眼鏡。

讓AI掀開視障人士眼前的簾子

“眼前的黑不是黑,你說的白是什么白”

即使現(xiàn)在的智能“助視”產品比比皆是,但要真的掀開視障患者眼前的簾子,恐怕還不容易。

首先,當我們不斷加大視障患者在其它感官上接受的信息量時,也會帶來不小的后患。比如,從聽覺入手的產品往往會讓使用者戴上耳機,這就會讓盲人與周遭的聲音隔絕,出行在外容易造成危險,而不帶上耳機進行電子播報,容易造成患者的信息外泄。

我們不斷地將智能產品應用在視障患者身上時,除了要為他們帶來生活上的方便,更是想讓他們看到這個美麗的世界,無障礙地探索這個世界。當我們用一種以其它感官來輔助視覺的技術思路來實現(xiàn)客觀上的無障礙的時候,肯定會與視障患者主觀上的無障礙有區(qū)別。

其次,可穿戴設備戴久了,尤其是戴在眼睛上,人們或多或少都會產生不適感。想想我們在電影院看3D電影的時候,3D眼鏡也曾讓我們頭暈目眩,沉浸式技術也極容易帶來頭暈、惡心等反應。除此之外,戴智能眼鏡限制了側面周邊的視覺范圍,視障患者要做到和正常人一樣的移動和工作還是不易。

然后,人造視網膜技術具有很強的綜合性和復雜性,需要機器視覺、IC設計、半導體工藝、納米技術、神經科學、生物材料等十多個學科的科學家和工程師全力投入,密切配合,缺一不可。但即便擁有如此高精度團隊,外界信息通過電信號傳遞到大腦中,盲人感受到的也不過是一個灰度的、馬賽克的世界。

即使是黑白的“渣像素”,也能勉強算“看見”了。而不能算“看見”的那些智能產品,比如智能眼鏡、認知助手等,僅僅只能提供語音讓患者接收到相應信息。患者能做的就是,在“助手”說前面有障礙物請繞過去時無奈繞開,而不能親眼看看阻攔自己的障礙物究竟是一個石頭還是一輛單車。

最后,這些智能“助視”產品最大的問題就在于它的成本太高,價格太貴,一般人很難負擔得起。由于致盲因素不同,很多盲人需要高度個性化定制的智能產品,這導致成本居高不下。即使是仿生眼球,也不能適用于所有視障患者,比如加拿大一家醫(yī)療科技公司Ocumentics在去年開發(fā)的仿生鏡片也只適合25歲以上的成年人,此外,患有角膜渾濁、接受過白內障手術、重度視網膜黃斑變性、重度遺傳性視網膜病變、視神經損傷等疾病的患者,亦不適合這一療法。

看得見,以看懂表情為標準

歸根究底,不管智能產品有多炫目,對盲人而言,他們更在乎智能產品的實用性,而真正實用的產品于他們而言就是三個字——看得見。

仿生眼球當然具有很大的市場,但上文中也提到,這種療法并不適用于所有眼科疾病。智能眼鏡+芯片的組合則是可以通用的,因為其視覺計算能力,人臉識別等功能可以接收外界信息,芯片通過柔性電極陣列來傳輸電信號,刺激視網膜的神經細胞,進而傳遞到大腦中,讓盲人看見黑白的影像。

但對于市場來說,通用的就不具有特殊性了,所以,誰能快速抓住“通用”中的亮點以及最不易解決的問題,誰就能在“助視”這方面成為佼佼者。

神經科學家認為“人臉識別”有兩個方面,其一是特征識別,也是目前的智能眼鏡配備的識別類型。其二是表情識別。事實上,經過了億萬年的進化,人類形成了六七種與情緒密切相關的基本表情,它們是:快樂、驚奇、悲傷、憤怒、厭惡、輕視和恐懼。這些基本表情是人的本能,不需要學習就與生俱來。

目前,我們對臉部特征與表情之間的區(qū)別還不太清楚。在我們看到一個人時,我們大腦里的人臉識別機制就會開始運作,我們會在一瞬間就判斷處這一張臉是不是熟面孔以及這個人的表情如何。但這一瞬間,對于視障患者卻難如登天。

所以,讓AI來幫助盲人看到人的表情或許是智能“助視”在人臉識別上的真正戰(zhàn)場。這一舉動的意義不止在于需要AI去識別更細微的臉部特征,還在于要為盲人獲得更加清晰的圖案,而不是模糊的一個影像。

英國《柳葉刀·全球衛(wèi)生》有一份研究報告預計,當下,全球盲人數(shù)量為3600萬,如果不加強對眼疾的治療,到2050年將增至1.15億。這是一個足夠驚人的數(shù)據(jù),而借助技術的力量,我們希望,每一個在生活中艱難獨行的盲人,不論他們的年齡大小、環(huán)境狀況如何、貧窮或富有,他們都有和明眼人一樣看美麗世界的權利。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號