訂閱
糾錯(cuò)
加入自媒體

CVPR2020 Oral: 一張照片三維重建你的房間

總  結(jié)

我們提出了一種基于單張圖像的端到端室內(nèi)場(chǎng)景重建方法。此方法對(duì)場(chǎng)景理解和網(wǎng)格重建進(jìn)行聯(lián)合訓(xùn)練,自動(dòng)生成房間布局、攝像機(jī)姿態(tài)、物體包圍盒和三維網(wǎng)格,以完全恢復(fù)房間和室內(nèi)物體的幾何信息。實(shí)驗(yàn)表明,本文的聯(lián)合學(xué)習(xí)方法顯著地提高了每個(gè)子任務(wù)的性能,且每個(gè)階段的場(chǎng)景解析過程都對(duì)其他階段有著潛在的影響。這說明了對(duì)所有階段進(jìn)行聯(lián)合訓(xùn)練的必要性。本文方法的一個(gè)局限是,學(xué)習(xí)物體的三維網(wǎng)格形狀時(shí),需要用稠密點(diǎn)云進(jìn)行全監(jiān)督訓(xùn)練。而在真實(shí)場(chǎng)景中獲取較精確的稠密點(diǎn)云需要耗費(fèi)大量的人力。為了解決這個(gè)問題,我們計(jì)劃在未來的工作中嘗試自監(jiān)督或弱監(jiān)督的學(xué)習(xí)方式。

關(guān)于團(tuán)隊(duì):香港中文大學(xué)(深圳)GAP實(shí)驗(yàn)室

該工作由香港中文大學(xué)(深圳)GAP實(shí)驗(yàn)室主導(dǎo)完成。GAP實(shí)驗(yàn)室取名于Generation and Analysis of Pixels, Points and Polygons;谏钲谑写髷(shù)據(jù)研究院與香港中文大學(xué)(深圳),該實(shí)驗(yàn)室在韓曉光博士的帶領(lǐng)下,致力于探索和解決圖片、視頻及三維內(nèi)容的生成與分析方面的難題,其主要研究方向涵蓋計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)。

該工作主要由伯恩茅斯大學(xué)博士生聶隱愚在GAP實(shí)驗(yàn)室交換期間完成。團(tuán)隊(duì)成員還包括香港中文大學(xué)(深圳)研究助理教授韓曉光博士、廈門大學(xué)副教授郭詩(shī)輝博士、香港中文大學(xué)(深圳)博士生鄭玉健及伯恩茅斯大學(xué)常建教授與張建軍教授。

References:

[1] Gkioxari, G., Malik, J. and Johnson, J., 2019. Mesh r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (pp. 9785-9795).

[2] Pan, J., Han, X., Chen, W., Tang, J. and Jia, K., 2019. Deep Mesh Reconstruction from Single RGB Images via Topology Modification Networks. In Proceedings of the IEEE International Conference on Computer Vision (pp. 9964-9973).

[3] Hu, H., Gu, J., Zhang, Z., Dai, J. and Wei, Y., 2018. Relation networks for object detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 3588-3597).

[4] Groueix, T., Fisher, M., Kim, V.G., Russell, B.C. and Aubry, M., 2018. A papier-m?ché approach to learning 3d surface generation. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 216-224).

[5] Huang, S., Qi, S., Xiao, Y., Zhu, Y., Wu, Y.N. and Zhu, S.C., 2018. Cooperative holistic scene understanding: Unifying 3d object, layout, and camera pose estimation. In Advances in Neural Information Processing Systems (pp. 207-218).

<上一頁(yè)  1  2  3  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)