訂閱
糾錯
加入自媒體

照片秒變icon?日本研究員提出基于生成對抗網(wǎng)絡(luò)的Iconify模型來幫忙!

AI圖標(biāo)化的新技能

為了驗證這兩種模型是否可以對圖像進行有效的圖標(biāo)化,研究人員分別對人體圖像、通用目標(biāo)和基于logo訓(xùn)練的圖標(biāo)化模型進行了實驗。

針對人體的圖標(biāo)化,研究人員僅僅利用了包含人體的圖像和對應(yīng)的圖標(biāo)進行訓(xùn)練。通過分類限制訓(xùn)練樣本的多樣性可以看到GANs圖標(biāo)化的能力。在訓(xùn)練過程中僅僅使用了包含部分人體的圖像,同時去除了多人的圖標(biāo),最終利用從72張icon增強的1440張圖標(biāo)和1684張真實人體圖像進行了訓(xùn)練。下圖顯示訓(xùn)練的數(shù)據(jù)樣本

下面分別比較了CycleGAN和UNIT模型對于人體圖標(biāo)化的結(jié)果,可以看到兩種模型都可以較好地圖標(biāo)化人體圖像,實現(xiàn)了對于人體的有效抽象。其中CycleGAN生成額結(jié)果更好,對于頭部和身體的形狀更為簡化。但針對面部特征的圖標(biāo)化不太好主要是由于訓(xùn)練圖標(biāo)數(shù)據(jù)中缺乏有效的面部細節(jié)特征。

由于CycleGAN具有循環(huán)損失,所以研究人員還對圖標(biāo)化后的結(jié)果進行了圖像化,下圖顯示了圖像到圖標(biāo)再到圖像的生成結(jié)果,以及圖標(biāo)到圖像再到圖標(biāo)的結(jié)果,顯示了模型對于圖像和圖標(biāo)抽象能力的理解。

隨后研究人員將圖標(biāo)化的過程拓展到了COCO中包含的通用物體上。由于物體的形狀各異、顏色紋理各不相同,模型需要處理的映射更為復(fù)雜。為此研究人員利用了由粗到精的策略來訓(xùn)練CycleGAN,依次在32x32,64x64,128x128,最終在256x256上進行訓(xùn)練。

下圖顯示了最終訓(xùn)練后生成的結(jié)果,其中橘色框中顯示了未參與訓(xùn)練的測試圖像及其結(jié)果,很好地抽象并描述了圖像中的目標(biāo)。

盡管圖像為圖標(biāo)提供了較多的設(shè)計信息,但其結(jié)果與第一個任務(wù)中的圖標(biāo)相比還不夠抽象,與標(biāo)準(zhǔn)圖標(biāo)還有所差異。例如上圖中的鐘表圖像就抽象的不太好。由于沒有設(shè)計的通用準(zhǔn)則和標(biāo)準(zhǔn),針對常規(guī)物體的圖標(biāo)化顯示出了較大的差異性。

為了進一步驗證這種方法,研究人員還利用了彩色的logo數(shù)據(jù)集LLD對圖標(biāo)化任務(wù)進行了訓(xùn)練,使得CycleGAN生成彩色的圖標(biāo)。與上一個任務(wù)相比,生成圖標(biāo)的質(zhì)量在色彩的幫助下有了很大的提升,例如下圖中的狗子圖標(biāo)化結(jié)果就比上圖中要好很多,雖然顏色可能與原始圖像有差異,但整體的配色與形狀和我們的審美協(xié)調(diào)。

不過上圖中藍色框內(nèi)也顯示了一些錯誤圖標(biāo)化的例子,例如鐘表沒有太多變化,第二個過于抽象化,第三、四個生成了文字,第五個則沒有保留明顯了目標(biāo)信息。這主要是由于目標(biāo)的背景、噪聲以及LLD的logo數(shù)據(jù)帶來的文字信息造成了一定影響。

但不可否認這種圖標(biāo)化的方法可以有效地對目標(biāo)圖像進行抽象處理,為設(shè)計師提供了創(chuàng)意參考、也為沒有設(shè)計基礎(chǔ)的小伙伴們提供了快速生成高質(zhì)量圖標(biāo)的好辦法吧~

<上一頁  1  2  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號