日本在线视频在线,日产精品久久久久久久性色,精品欧美国产一区二区三区不卡

蘋(píng)果最新專(zhuān)利忙著研究AI圖像合成，視覺(jué)靈敏度抑制算法精準(zhǔn)獲取人眼疲勞度！

2022-11-09 15:03

德高行知情郎

關(guān)注

知情郎·眼｜

侃透公司專(zhuān)利事兒

今天聊聊蘋(píng)果的新專(zhuān)利。

看看蘋(píng)果的工程師最近忙著解決哪些技術(shù)難點(diǎn)問(wèn)題，尤其在AI領(lǐng)域，有啥新進(jìn)展。

最近蘋(píng)果日子過(guò)的不大順當(dāng)，新產(chǎn)品iPhone?14因?yàn)猷嵵莞皇靠狄咔橐惭舆t交貨了。

01蘋(píng)果近期在忙啥

蘋(píng)果最近忙著搞生產(chǎn)！

人家集中精力忙iPhone?14產(chǎn)線如何恢復(fù)，幫著友商處理鄭州富士康問(wèn)題。

眾所周知，鄭州富士康園區(qū)是 iPhone 14 Pro 和 iPhone 14 Pro Max 的主要組裝工廠。

庫(kù)克老爺子對(duì)iPhone 14 Pro系列寄予厚望，希望新品上市發(fā)光發(fā)財(cái)，延續(xù)蘋(píng)果在高端機(jī)的統(tǒng)治力。

可吆喝了半天，幫蘋(píng)果組裝手機(jī)的富士康出了簍子。

這些天，鄭州富士康員工因疫情逃亡廠區(qū)的段子滿天飛，鄭州園區(qū)2萬(wàn)人確診疫情的消息，嚇壞了當(dāng)?shù)亍?/p>

這恐怖疫情嚇慫了園區(qū)，當(dāng)?shù)貑T工紛紛跑路！

網(wǎng)友調(diào)侃，疫情拖累了產(chǎn)能，郭臺(tái)銘也許現(xiàn)在焦慮的吃不下飯了！

要知道，鄭州園區(qū)是生產(chǎn)蘋(píng)果iPhone?14的主力部隊(duì)，國(guó)內(nèi)訂單大多數(shù)都由此地生產(chǎn)，現(xiàn)在園區(qū)隔離的隔離，封禁的封禁，一屁股地方，工人吃喝拉撒睡都在一起，搞得疫情感染人數(shù)都難統(tǒng)計(jì)了，還咋開(kāi)工。

更慘的是，庫(kù)克新品發(fā)布會(huì)剛吆喝半天蘋(píng)果14性能有多牛，然后就沒(méi)下文了。

現(xiàn)在園區(qū)產(chǎn)線雞飛蛋打，也不知道何時(shí)能復(fù)工。

沒(méi)辦法，蘋(píng)果再牛，也得為疫情讓道，得照顧大陸園區(qū)員工的情緒，也只有延后訂單生產(chǎn)，支持富士康寬慰工人！

人家日前發(fā)了公告表示支持富士康抗疫，優(yōu)先保障員工健康。

這局勢(shì)，估計(jì)明年蘋(píng)果，富士康轉(zhuǎn)向印度越南的舉措會(huì)更激進(jìn)，一向以穩(wěn)定、執(zhí)行力強(qiáng)的大陸園區(qū)都出簍子了，還不積極分拆供應(yīng)鏈。

哎，制造業(yè)不容易啊，富士康的工人更不容易，為這5000薪水拼死拼活！

02蘋(píng)果最新公開(kāi)專(zhuān)利在研究啥

聊完業(yè)務(wù)動(dòng)態(tài)，聊專(zhuān)利。

下面蘋(píng)果關(guān)于AI方面的最新八個(gè)公開(kāi)專(zhuān)利，多數(shù)圍繞姿態(tài)識(shí)別、視頻音頻AI檢測(cè)還原、影像數(shù)據(jù)合成等領(lǐng)域。

最近，知情郎很關(guān)注AI技術(shù)，所以就找各大科技公司這方面的專(zhuān)利！看看人家工程師忙著處理哪些AI技術(shù)難點(diǎn)！

序號(hào)標(biāo)題標(biāo)題（英文）解決的技術(shù)問(wèn)題公開(kāi)號(hào)

使用多個(gè)傳感器的基于機(jī)器學(xué)習(xí)的姿勢(shì)識(shí)別

MACHINE－LEARNING BASED GESTURE RECOGNITION USING MULTIPLE SENSORS

針對(duì)現(xiàn)有基于慣性傳感器的人體運(yùn)動(dòng)姿態(tài)識(shí)別中涉及特征較多、常用姿態(tài)識(shí)別方法不全面、識(shí)別精度不足等問(wèn)題，專(zhuān)利提供了手勢(shì)姿態(tài)識(shí)別及修正算法研究，通過(guò)特征提取與建庫(kù)、特征篩選、姿態(tài)識(shí)別與修正等過(guò)程進(jìn)行手勢(shì)軌跡、姿態(tài)判定，提高識(shí)別準(zhǔn)確率。

US20220351086A1

基于AI檢測(cè)或分類(lèi)結(jié)果的變化的視聽(tīng)壓縮

VARYING AUDIO VISUAL COMPRESSION BASED ON AI DETECTION OR CLASSIFICATION RESULTS

圖像壓縮是數(shù)據(jù)壓縮（Data Compression）的一種，因?yàn)閳D像壓縮減少了編碼圖像所需的數(shù)據(jù)位，但同時(shí)又保留了圖像細(xì)節(jié)�；谏疃葘W(xué)習(xí)的圖像壓縮算法的先進(jìn)技術(shù)，包括多層感知器、卷積神經(jīng)網(wǎng)絡(luò)和生成對(duì)抗網(wǎng)絡(luò)已發(fā)展多年，該專(zhuān)利提供一種AI模型算法，可幫助構(gòu)建并精細(xì)化處理圖像和壓縮模型，也方便迅速鎖定目標(biāo)圖像。

US20220353458A1

用于空間音頻再現(xiàn)的時(shí)域神經(jīng)網(wǎng)絡(luò)

Time domain neural networks for spatial audio reproduction

語(yǔ)音增強(qiáng)涉及將目標(biāo)語(yǔ)音信號(hào)與干擾性背景區(qū)分開(kāi)來(lái)。盡管近年來(lái)使用變異自動(dòng)編碼器或生成對(duì)抗網(wǎng)絡(luò)（GANs）的生成方法已被越來(lái)越多地使用，但弊端也不少。該專(zhuān)利提供了一種新的技術(shù)方案來(lái)強(qiáng)化捕捉麥克風(fēng)聲音并強(qiáng)化了多音道信號(hào)，讓過(guò)去的音頻效果還原度更高！

US11490218B1

利用反向網(wǎng)生成更真實(shí)的合成數(shù)據(jù)

Generating more realistic synthetic data with adversarial nets

為了修改合成數(shù)據(jù)使得鑒別網(wǎng)絡(luò)不能可靠地辨別細(xì)化的合成數(shù)據(jù)和真實(shí)數(shù)據(jù)之間的差別，可以在對(duì)抗設(shè)置中學(xué)習(xí)生成網(wǎng)絡(luò)。生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)可以一起工作，以學(xué)習(xí)如何以降低的計(jì)算成本產(chǎn)生更真實(shí)的合成數(shù)據(jù)。該專(zhuān)利提供了一種技術(shù)而方案，讓合成數(shù)據(jù)更加逼近真實(shí)，難以被鑒別。

US11475276B1

使用基于圖像捕獲條件選擇的先驗(yàn)概率分布的計(jì)算機(jī)視覺(jué)

Computer vision

using a prior probability distribution selected based on an image capture condition

訓(xùn)練機(jī)器學(xué)習(xí)（ML）模型并將其用于產(chǎn)生與計(jì)算機(jī)視覺(jué)任務(wù)相關(guān)聯(lián)的概率分布。ML模型使用與基于傳感器數(shù)據(jù)確定的特定圖像捕獲條件相關(guān)聯(lián)的先驗(yàn)概率分布。因此，機(jī)器學(xué)習(xí)模型被給予圖像作為輸入以及特定圖像捕獲設(shè)備條件的先驗(yàn)概率分布。使用先驗(yàn)概率分布可以提高用于計(jì)算機(jī)視覺(jué)任務(wù)的ML學(xué)習(xí)模型的準(zhǔn)確性，效率或有效性。

US11468275B1

在部分潮濕條件下檢測(cè)顯示器上的觸摸用戶界面

Detecting touch user interface on a display under partial wet conditions

當(dāng)液體存在于顯示器上時(shí)，會(huì)導(dǎo)致接觸不靈。觸摸屏或帶有觸摸輸入組件的顯示器通常使用電容技術(shù)，通過(guò)測(cè)量由觸摸輸入引起的靜電場(chǎng)的變化來(lái)檢測(cè)觸摸輸入或用戶輸入到觸摸屏的位置。在某些情況下，無(wú)論是否檢測(cè)到觸摸輸入，液體都會(huì)引起靜電場(chǎng)的變化。結(jié)果，液體降低了觸摸輸入組件準(zhǔn)確檢測(cè)觸摸輸入位置的能力，并且在某些情況下，觸摸輸入組件根本無(wú)法檢測(cè)觸摸輸入。然而，本專(zhuān)利提供的技術(shù)方案可克服這些問(wèn)題。

US11422689B1

用于圖像創(chuàng)建的分類(lèi)

Classification for image creation

各種技術(shù)被用于生成圖像內(nèi)容。例如，一些技術(shù)使用生成性對(duì)抗性神經(jīng)網(wǎng)絡(luò)（GAN）來(lái)生成圖像內(nèi)容，以提供看起來(lái)像可信場(chǎng)景的內(nèi)容。但是，基于回歸的技術(shù)所生成的內(nèi)容還可能遭受邊緣處不希望的銳度缺乏、結(jié)構(gòu)中缺乏銳度或清晰度、或者以其他方式呈現(xiàn)模糊，從而降低內(nèi)容的真實(shí)性。專(zhuān)利提供了使用基于分類(lèi)的機(jī)器學(xué)習(xí)來(lái)為圖像的缺失部分（例如，一些或全部）生成感知上可信的內(nèi)容的系統(tǒng)和方法。

US11423308B1

自主車(chē)輛運(yùn)動(dòng)控制的決策

Decision making for autonomous vehicle motion control

一種用于車(chē)輛的行為規(guī)劃器使用樹(shù)搜索算法和從一個(gè)或多個(gè)機(jī)器學(xué)習(xí)模型獲得的試探法來(lái)生成車(chē)輛的多個(gè)條件動(dòng)作序列。每個(gè)序列對(duì)應(yīng)于車(chē)輛的預(yù)期狀態(tài)序列。至少一些動(dòng)作序列被提供給車(chē)輛的運(yùn)動(dòng)選擇器。運(yùn)動(dòng)選擇器基于接收到的條件動(dòng)作序列和從車(chē)輛的一個(gè)或多個(gè)傳感器接收到的數(shù)據(jù)來(lái)生成運(yùn)動(dòng)控制指令，并將指令發(fā)送到車(chē)輛的控制子系統(tǒng)。

US11403526B2

03檢測(cè)眨眼提高視覺(jué)舒適度方案

上面的專(zhuān)利其實(shí)具體解讀起來(lái)都較復(fù)雜，涉及AI算法，大量的數(shù)據(jù)公式。

給大家解讀一個(gè)相對(duì)簡(jiǎn)單易懂、實(shí)用性強(qiáng)的專(zhuān)利。

專(zhuān)利名：具有基于眼睛活動(dòng)的顯示器操作的電子設(shè)備（CN115167664A），該專(zhuān)利提供了一種用于頭顯的眼睛監(jiān)測(cè)系統(tǒng)，專(zhuān)門(mén)檢測(cè)用戶的眼睛掃視（saccade）和眨眼。

專(zhuān)利摘要：在掃視和眨眼期間，用戶的視覺(jué)靈敏度被暫時(shí)抑制。電子設(shè)備中的控制電路可利用對(duì)用戶的視覺(jué)靈敏度的暫時(shí)抑制來(lái)對(duì)顯示器的操作進(jìn)行調(diào)節(jié)。例如，控制電路可協(xié)調(diào)顯示器的操作與掃視和眨眼所關(guān)聯(lián)的視覺(jué)靈敏度抑制時(shí)間段，以降低功率消耗和／或進(jìn)行可能突兀的圖像變化。通過(guò)在視覺(jué)靈敏度抑制時(shí)間段內(nèi)進(jìn)行調(diào)節(jié)，可向電子設(shè)備的用戶隱藏這些調(diào)節(jié)。

簡(jiǎn)單說(shuō)，這個(gè)技術(shù)方案就是檢測(cè)用戶眼部狀態(tài)，用算法解析視覺(jué)靈敏抑制時(shí)間線變化，讓頭顯等設(shè)備調(diào)節(jié)畫(huà)面亮度時(shí)，盡量配合用戶眼部狀態(tài)。

即，盡量不要在用戶眨眼、閉眼時(shí)，變化顯示器亮度或者可能突兀的圖像變化。強(qiáng)光、強(qiáng)畫(huà)面變化會(huì)加劇用戶眼部的不適度。所以要避免！

亮點(diǎn)在哪？

這個(gè)專(zhuān)利最大的亮點(diǎn)是如何確定用戶眼睛處于視覺(jué)敏度抑制狀態(tài)。

人類(lèi)眨眼閉合是可以被機(jī)器捕捉并觀察的，最后能用數(shù)據(jù)曲線體現(xiàn)。

人類(lèi)視網(wǎng)膜的光受體分布是不均勻的，因此視敏度隨著與具有最高光受體密度的視網(wǎng)膜位置的距離而下降，該位置通常被稱(chēng)為中央凹。掃視是快速、急促且大多為彈道式的眼睛旋轉(zhuǎn)。人類(lèi)每秒進(jìn)行幾次掃視眼睛運(yùn)動(dòng)，以利用視網(wǎng)膜的該最高分辨率部分來(lái)觀察所關(guān)注的對(duì)象。

眨眼是眼瞼完全或部分地短暫閉合，以清潔、潤(rùn)濕角膜以及對(duì)角膜供氧。眨眼是半自動(dòng)的行為，大部分是反射性地做出以避免刺激物，或例行地將淚液鋪展在角膜表面上。人類(lèi)根據(jù)各種條件每分鐘眨眼許多次。

蘋(píng)果的工程師就利用上述人類(lèi)眼睛的特性，通過(guò)硬件設(shè)備采集用戶眼睛活動(dòng)如眨眼眼瞼位置變化以及對(duì)光亮的反應(yīng)度，并用算法理解人眼的視覺(jué)靈敏抑制期對(duì)光的忍耐度，從而調(diào)整顯示設(shè)備。

舉個(gè)例子，眼瞼完全閉合可導(dǎo)致入射到用戶眼睛視網(wǎng)膜上的光減少500倍以上。眨眼的持續(xù)時(shí)間（例如，眼瞼開(kāi)始其閉合運(yùn)動(dòng)和它們完全打開(kāi)時(shí)之間的時(shí)間間隔）在約200ms至500ms的范圍內(nèi)。由于眼瞼閉合而造成的光損失可被視為“被動(dòng)”抑制；用戶的視覺(jué)系統(tǒng)在該部分中不發(fā)揮作用，它僅僅是由于光的物理遮擋而發(fā)生的。

除了由于眼瞼閉合而造成的光損失之外，在眨眼事件期間，視覺(jué)靈敏度被用戶的大腦主動(dòng)抑制。

因此，通常存在約100ms－200ms的時(shí)間，在此期間，對(duì)顯示器的操作的改變可能不會(huì)被用戶在視覺(jué)上察覺(jué)。視覺(jué)靈敏度的掃視抑制可在掃視（其可持續(xù)約20至100ms）期間，以及在掃視稍稍前后（例如，在每次掃視前50ms和之后高達(dá)200ms）發(fā)生。

眨眼往往以大約每分鐘10－20次眨眼的速率發(fā)生，由于光在眨眼期間被用戶的眼瞼遮擋，可與較強(qiáng)的視覺(jué)靈敏度損失相關(guān)聯(lián)。因此，在嘗試對(duì)用戶掩蔽可能具有破壞性的顯示器調(diào)節(jié)（例如，在掃視期間可能被感測(cè)到的亮度調(diào)節(jié)和其他調(diào)節(jié)）時(shí)，可能特別有益的是利用眨眼誘發(fā)的視覺(jué)靈敏度抑制。

一般來(lái)講，控制電路可在與眼睛事件（例如，由系統(tǒng)檢測(cè)到的掃視和／或系統(tǒng)檢測(cè)到的眨眼）相關(guān)聯(lián)的視覺(jué)靈敏度降低的任何適當(dāng)時(shí)間段內(nèi)進(jìn)行顯示器操作調(diào)節(jié)。

總的來(lái)說(shuō)，這個(gè)專(zhuān)利就在講如何根據(jù)眼睛眼瞼閉合張開(kāi)狀態(tài)來(lái)確定用戶的視覺(jué)光敏反應(yīng)度，當(dāng)用戶處于視覺(jué)靈敏抑制狀態(tài)，就要對(duì)顯示器的亮度、圖像變化進(jìn)行微調(diào)，使其處于低功率狀態(tài)，盡量避免影響用戶視覺(jué)不適，乃至產(chǎn)生關(guān)聯(lián)的暈動(dòng)癥、甚至惡心。

【轉(zhuǎn)載請(qǐng)注明德高行·知情郎】

原文標(biāo)題 : 蘋(píng)果最新專(zhuān)利忙著研究AI圖像合成，視覺(jué)靈敏度抑制算法精準(zhǔn)獲取人眼疲勞度！