我聽起來有病嗎?
通過一個6秒鐘的元音“啊——”,或者從50大聲數到70,就能“聽”出你是否得了COVID-19,是不是很不可思議?沒錯,作為一種算法驅動的安全、可訪問且非侵入式的篩查工具,它正勢不可擋地直面公眾。
日前國際權威期刊《柳葉刀·數字健康》發(fā)表一篇述評稱,“這些技術有潛力通過在個人設備上運行的快速、經濟的診斷,顯著改善全球健康——這是對抗流行病的完美工具!痹谂c新冠病毒的斗爭可能長期化的大背景下,語音生物標志物(Biomarker)在數字健康領域的應用熱點正在加速度發(fā)展,并促動院外生命體征監(jiān)測、家庭場景下的個體化醫(yī)療市場成為“香餑餑”。那么,AI技術真的能確定“我有病嗎”?
01
在對抗COVID-19中顯山露水
在新冠肺炎疫情肆虐的美國,語音生物標志物技術公司Sonde Health正在協助“聽音判病”。
Sonde Health成立于2015年,總部位于波士頓,可基于語音生物標志物進行聲學分析,從而診斷和監(jiān)測人體健康狀況,提供疾病篩查和管理解決方案。用戶通過智能手機訪問名為Sonde One的應用軟件,即可看到“呼吸系統(tǒng)癥狀風險”的部分,完成一份簡單問卷(包含7個問題)之后,按要求吸氣并保持一個元音“啊——”的語音至少6秒鐘,該應用程序就會告訴用戶其所處的風險狀態(tài)。
該應用程序依賴于Sonde Health建立在從80,000多個人收集的超過100萬個人類聲音樣本上的機器學習模型,感知和分析聲音中的細微變化,來識別例如咳嗽、哮喘、COPD(慢性阻塞性肺疾病)等呼吸系統(tǒng)疾病的癥狀,6秒鐘的語音采樣可以實現檢測的準確率達70%以上。Sonde Health首席執(zhí)行官David Liu表示,“無論是呼吸系統(tǒng)疾病、哮喘還是COVID-19,給我們6秒鐘的聲音片段,即可清楚地告訴用戶,他的健康狀況怎樣”。
雖然應用程序篩查不能代替臨床醫(yī)生的診斷,但可用作COVID-19的早期預警系統(tǒng)。而且,這種操作,就如同測量體溫或血壓一樣簡單。目前,美國和印度的10家公司正在使用Sonde Health的技術來幫助員工篩查 COVID-19,David Liu表示,如果每天有很多人使用它,其語音篩查測試可能有助于遏制激增的流行病。另一家以色列初創(chuàng)公司Vocalis Health同樣聚焦于醫(yī)療領域的人工智能和語音分析應用。
今年2月份,Vocalis Health宣布,其COVID-19篩查工具Vocalis Check在大型臨床研究中成功驗證,并已獲得CE標志,成為首個獲得CE批準的 COVID-19篩查醫(yī)療設備。
Vocalis Check是一款軟件,同樣可通過智能手機或Web應用程序訪問。用戶只需從50數到70,其錄音就會被轉換為包含512個語音生物標志物組成的圖像,即頻譜圖,應用人工智能,這些圖片與基于臨床試驗中COVID-19陽性參與者的錄音的合成圖像進行比較,以確定它們之間的相關性。在不到一分鐘的時間里,Vocalis Check將做出判斷,再通過隨后的拭子測試進行驗證或否定。
Vocalis Health一直在收集公共聲音樣本,并與以色列國防部協調,從而獲取明確感染者的頻譜圖。據稱,Vocalis Health的COVID-19聲音生物標志物在評估一個人是否感染 COVID-19的風險方面準確度超過80%。目前市場上檢測COVID-19主要是PCR核酸檢測法,這是一種相對昂貴、資源密集和耗時的方法。而利用聲音生物標志物這樣的高度可擴展的篩查方法可以填補當前COVID-19篩查方法的空白。
Vocalis Health還與大孟買市政公司 (MCGM) 合作,在COVID-19大流行期間設立的醫(yī)療中心開展為期一個月的聲音測試試點,測試了2000多人,包括英語、印地語、馬拉地語和古吉拉特語等,以突破語言本身的限制。Vocalis Health首席醫(yī)療官Shady Hassan博士認為,聲音生物標志物檢測并非旨在取代PCR測試,這是為了篩查,而不是診斷。
通過快速廣泛的篩查提供可靠的風險評分來指導可能需要額外診斷測試的人,從而使衛(wèi)生系統(tǒng)能夠更有效地分配診斷資源,這也是聲音生物標志物檢測的重要價值之一。
02
心理和精神疾病領域的探索
相對于像COVID-19這樣的生理疾病,也許更引人關注的,是人工智能驅動的語音生物標志物識別技術是否能夠幫助診斷心理和精神疾病。
以前,我們總將生理疾病的考慮優(yōu)先于精神疾病,因為生理疾病更容易被監(jiān)測和治療,而現在,人們正在更加開放地看待精神健康問題,那么,語音生物標志物可否用于精神疾病的“數字化”?
人類在說話時,哪怕是一個簡單的詞語,都需要大腦中的多個神經回路進行復雜協調、對呼吸系統(tǒng)進行精確的控制、掌握好協調的肌肉骨骼系各個部分的激活時間,這樣才能控制整個聲道的發(fā)音清晰度。人體在發(fā)聲時對于全身系統(tǒng)協調的依賴,可為研究機構提供監(jiān)測疾病的新思路。
因為人體發(fā)聲的同時會產生相應的生物標記物,當身體出現健康問題時,疾病的特異性干擾會對某個系統(tǒng)或多個系統(tǒng)產生細微、難以察覺、但具有特性的變化,生物標記物含量由此產生變化。而這種變化,是可以利用機器來進行分析計算的。
此類變化和關聯無法被人耳識別,但卻可以被語音生物標記技術檢測到。這和我們的視力很相似,人眼可以看到一個特定的光譜,但實際上現實中還存在更多的光譜,我們肉眼并不能看到。以抑郁癥為例,患者往往會表現出言語遲緩、音量不穩(wěn)定、發(fā)聲顫抖、語言韻律異常等癥狀。
麻省理工學院(MIT)林肯實驗室的研究發(fā)現,抑郁癥患者治療前較治療后,聲帶發(fā)聲的時刻和強度在每次聲帶振動的周期中,波動都比較顯著,并且波動程度與抑郁癥的嚴重程度呈正相關。隨后,他們利用自動分類算法,實現了精確度可以達到80%-90%的抑郁癥預測。Sonde Health已在這項技術的基礎上,研發(fā)了用于檢測和診斷精神疾病的產品。Sonde Health很早就意識到聲音對個人健康有意義的預測指標,開始研究語音和不同疾病之間的關聯。比如,建立語音和MRI腦白質(抑郁癥診斷)之間的關聯,語音和海馬體萎縮(老年癡呆診斷)之間的關聯,等等。
目前,Sonde Health已經經過臨床實驗證明,通過智能手機,在不記錄人們具體說話內容,僅提取語音特征的情況下,通過分析患者語音的短片段,便可查找可能指向早期健康狀況的異,F象,監(jiān)測從呼吸系統(tǒng)疾病到帕金森病、慢性老年病等各種疾病,以及人體精神問題,包括抑郁癥、產后抑郁、認知障礙和腦震蕩等。
Sonde Health的語音識別技術在不斷發(fā)展迭代。第一代技術在使用時,要求用戶必須閱讀固定文本或回答問題,且用戶必須處在特定環(huán)境中進行。目前,Sonde Health技術已可導入手機等隨身電子設備中,通過語音實時監(jiān)控用戶健康情況,并及時提供治療方案。Sonde Health首席運營官Jim Harper聲稱,“當我們分析語音時,并不關心內容,而是關注語音中各指標的變化!
其實,Sonde Health并不是第一個將語音生物識別技術應用于心理疾病檢測的組織。2015年,紐約大學Langone醫(yī)學中心的研究人員便探索出了機器學習AI軟件在健康領域的用途,該軟件旨在通過語音生物特征識別PTSD(創(chuàng)傷后應激障礙)、抑郁癥以及其他心理疾病。研究人員使用神經網絡發(fā)現了30種語音特征,比如,機器學習算法顯示,在250多名患有創(chuàng)傷后應激障礙的個體中,發(fā)音中的元音間隔明顯縮短等。
這些特征可能區(qū)分出創(chuàng)傷后應激障礙的退伍軍人和未受影響的退伍軍人(或健康對照組),這個方法被用于一項為期5年的前瞻性大型隊列研究。在開發(fā)的早期階段,研究人員就發(fā)現該系統(tǒng)可以診斷PTSD的準確性為77%。2016年,梅奧診所與以色列語音分析公司Beyond Verbal(該公司后與Healthymize公司合并為Vocalis Health)合作的研究發(fā)現,13個語音特征和冠心病存在相關性,其中一個語音特征會增加冠心病19倍的發(fā)生概率。
這項研究首次發(fā)現語音特征和純粹的身體疾病存在相關性,這意味著,醫(yī)生可以使用語音分析的軟件作為一種無創(chuàng)、輔助診斷工具。目前,語音生物標志物技術領域除了Vocalis Health與Sonde Health,還包括抑郁癥診斷語音分析領域的龍頭Ellipsis Health(該公司剛完成2600萬美元A輪融資),AI語音診斷技術研發(fā)商Winterlight Labs,以及專注識別焦慮和抑郁等疾病的Kintsugi(該公司剛完成一輪800萬美元的種子輪融資)。市場研究和咨詢公司Fact.MR的報告預測,在2018-2027年的預測期內,語音生物標志物的全球市場將達到23.3%的年復合增長率。
但一些計算機科學家對使用人工智能來追蹤精神障礙,特別是像抑郁癥這樣的嚴重障礙持保留意見,認為通過語音檢測抑郁癥的想法很難提供出高度精確的結果。另外,擔心該技術避免不了AI技術的“偏見”頑疾,出現誤診。
03
打開個體化醫(yī)療之門?
語音技術一直是這兩年資本市場和巨頭追逐的寵兒。
從蘋果的Siri,微軟的Cortana,谷歌的google Assistant這樣的語音助理,以及Amazon Echo和Google Home進入客廳和臥室的智能音箱,到科大訊飛不斷提升的語音識別技術。語音技術已融入我們日常生活的很多場景,而現在,它正在健康醫(yī)療領域開疆拓土。
對于個人的健康監(jiān)測來說,醫(yī)院的監(jiān)測往往只是一個“快照”,無法撲捉連續(xù)的問題發(fā)生,持續(xù)監(jiān)測則可以捕獲醫(yī)院中遺漏的重大身體變化。如何將持續(xù)的數據與臨床相結合?家庭場景下能保證監(jiān)測精度的語音生物識別工具,或許是個有效解決方案;诼曇舻募膊z測技術無創(chuàng)傷、便宜,可實現實時、長期監(jiān)測,且尤其適合在遠程醫(yī)療中使用,這意味著可以覆蓋到更廣闊的地區(qū),惠及更多人群和擴大數據采集范圍。它將可能成為亞健康人群或疾病患者的剛需,亦或健康人群進行身體健康管理的工具。
這一領域背后存在的巨大商業(yè)機會,吸引著后來者不斷進場。有業(yè)界人士表示,手機上的身體健康指標的監(jiān)測有著非常大的市場需求,如果搞定它,將獲得巨大的回報。Jim Harper表示,醫(yī)療健康領域最古老的工具之一溫度計,因其簡單易操作以及在臨床環(huán)境之外的廣泛可用性,成了最有價值的醫(yī)療工具之一。
Sonde Health則希望利用每天數十億的語音交互,來創(chuàng)建一個21世紀的“溫度計”,提供精準醫(yī)療和早期醫(yī)學模式下所需的廣泛數字醫(yī)療的決策支持。反觀國內,雖然“聲量”不大,但也有企業(yè)已經介入語音診斷技術。比如,科慧健遠研發(fā)的AI病理機器人,正在入局兒童自閉癥及語言發(fā)育障礙市場。其研發(fā)的AI病理系列機器人利用人工智能人臉識別技術、眼線眼動數據分析技術、病理語音數字分析技術、自閉癥及語言相關障礙篩查系統(tǒng),對語言發(fā)育遲緩、兒童構音障礙、自閉癥、語言運動全面發(fā)育遲緩等疾病進行篩查和識別。其中,病理語音數字分析技術通過提取相關聲學特征參數,計算出綜合聲學參數,采用雙模塊權重綜合的方法,篩選出兒童構音障礙。而專注做“情緒體檢”的想象科技在2017年就成立了Wonder AI Lab,以探索AI+心理健康的可能性。
2018年,研發(fā)出感知AI模型,該模型可實時識別個人情緒,再綜合心理、精神疾病等多學科知識交叉運用,基于權威EQ專家所標記的350多萬個情感音頻數據,智能語音心理健康平臺健康歐(Relax O)應運而生。只需8秒鐘的語音片段,健康歐便可識別用戶情緒,精準度高達95%,據稱該項技術甚至領先谷歌。并且,健康歐可提供可視化的情緒卡片解讀,且生成聲音治愈、深度放松、呼吸減壓相結合的個性化情緒調節(jié)方案,利用3分鐘釋放大腦壓力,恢復身心的最佳狀態(tài)。
當下,我國越來越重視生命科技和基礎科學研究,醫(yī)療健康產業(yè)提升到了前所未有的戰(zhàn)略高度。而隨著經濟的發(fā)展和社會的進步,“預測性、預防性、個體化、參與性”(Preventive、Predictive、Personalized、Participatory)的“4P”醫(yī)學將替代傳統(tǒng)以治為主的診療方式,個體化醫(yī)療正越來越受到臨床醫(yī)學界的重視。目前全球個體化醫(yī)療檢測的市場主要分布在北美、歐洲、日本等發(fā)達經濟體國家。而在中國,個體化醫(yī)療市場需求正在“抬頭”。
生物標志物是實施個體化醫(yī)療的基礎,其中,語音生物標記物診斷市場或許會成為增量巨大的熱點之一。未來在可觀的業(yè)務收入及利潤空間的吸引下,可以想象,隨著各方有實力的玩家入場,AI語音診斷市場將迎來屬于自己的新格局。
請輸入評論內容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
8 BD新浪潮
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市