訂閱
糾錯
加入自媒體

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

經(jīng)過圖像處理后,每個循環(huán)群

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

將變化為

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

命題3里,我們假設(shè)T和J具備交換律,那么我們可以將上面的公式改寫,并得到

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)


CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

原分布D不具備視覺手性意味著:每個循環(huán)群

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

中的元素都有相同的概率出現(xiàn)。因此,由于經(jīng)過J圖像處理后循環(huán)群變?yōu)榱?/p>

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

,我們只需要證明以下運(yùn)算為同態(tài)(homomorphism):

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

因為對于同態(tài)來說,根據(jù)第一同構(gòu)基本定理(First Isomorphism Theorm)可以推理出每個輸出對應(yīng)著相同數(shù)量的輸入。而因為每個循環(huán)群中單個輸入

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

在原分布D上有著相同的概率,意味著每個輸出

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

也具備相同的概率,也意味著

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

不具備視覺手性。證明同態(tài)的步驟如下:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

以上為命題3的證明。通過命題3,我們知道了J和T的交換律與處理后圖像分布的視覺手性的關(guān)系。那么,只需要通過檢查交換律,我們便可以判斷圖像處理是否可能產(chǎn)生新的視覺手性。檢查的方式也很簡單,對于任意圖片x,我們只需要計算其交換殘差(commutative residual)是否為0:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

下圖形象的解釋了交換殘差的計算過程:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

文中使用去馬賽克、JPEG壓縮、以及兩者結(jié)合這三種圖像處理方法,對于鏡像翻轉(zhuǎn)這一圖片變換方式分別計算了交換殘差。

當(dāng)去馬賽克處理的圖像寬度為奇數(shù)時,處理后的圖像分布可能具備視覺手性;反之如果為偶數(shù),則不具備視覺手性。當(dāng)JPEG壓縮的圖片不為16整除時,處理后的圖像分布可能具備視覺手性,反之則不具備。當(dāng)兩者結(jié)合后,處理后的圖片一定具備視覺手性:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

作者為了驗證這些結(jié)論,在原本不具備視覺手性的人工數(shù)據(jù)集(高斯分布生成的隨機(jī)圖片)上,對不同寬度的圖片分別進(jìn)行了這三種處理,并使用神經(jīng)網(wǎng)絡(luò)進(jìn)行了自監(jiān)督學(xué)習(xí)。實驗結(jié)果符合這一測試的預(yù)期。因為大量互聯(lián)網(wǎng)圖片都經(jīng)過了去馬賽克和JPEG壓縮,這一結(jié)論意味著數(shù)字圖像處理所帶來的視覺手性現(xiàn)象在互聯(lián)網(wǎng)圖片中廣泛存在。

當(dāng)加入隨機(jī)剪裁(random cropping)后,我們還能得到這一結(jié)論么?作者的答復(fù)是肯定的。

為了理解隨機(jī)剪裁對于視覺手性的影響,作者提到了兩個關(guān)鍵點。

第一點:命題三中只討論了單種J的情況。而隨機(jī)剪裁可以被視為許多種J(例如

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

是向右平移一格并剪裁,

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

是向右平移兩個并剪裁)的結(jié)合,每一種有相同概率出現(xiàn)。

第二點:命題三中并沒有討論T和J不具備交換律的情況。例如當(dāng)J是向?qū)D片右平移十個像素并進(jìn)行一次中心剪裁時,T和J無法具備交換律。在這種情況下,新的圖像分布并不一定具備視覺手性。

對于第一點來說,假設(shè)我們有多種不同的J(例如

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

,

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

,

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

),而他們分別與T具備交換律時,我們可以用以下公式表達(dá)新的圖像分布:

CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)

<上一頁  1  2  3  4  下一頁>  余下全文
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號