模擬人類視網(wǎng)膜 人臉識別技術研究的重大進步
卡內(nèi)基梅隆大學剛剛發(fā)布了其關于人臉識別的最新研究,由其改進的算法能夠從圖片中提取并編碼關鍵信息,也就是說能從人海中迅速提取面部信息。目前是人臉識別最熱門的創(chuàng)業(yè)方向之一,卡內(nèi)基梅隆大學的這項技術研究對于產(chǎn)業(yè)界的應用將起到很大的推動作用。

無論是在茫茫人海中提取面部信息,還是在大圖中識別出遠處/細小的物體,都對計算機視覺圖形提出了非常大的挑戰(zhàn)。憑借著多年的技術積淀,來自卡內(nèi)基梅隆大學的科研團隊終于找到了其中的訣竅——成功識別細小對象的關鍵就是尋找與之匹配的更大物體。
這種能夠從圖片中提取并編碼關鍵信息的改進算法,是由副教授 Deva Ramanan 和博士生 Peiyun Hu 共同推進的,可謂是識別微型人臉里程上的重大進步。 在面部的基準測試集中,此前的方法只能識別出 29% 到 64% 之間的正確人類面孔,而她們所提出的改進版算法減少了兩個導致誤差的隱私,從而將正確率提高到了 81%。 Ramanan 說道:「這就像是尋找在某個人手中的一根牙簽。當你提示對象可能會使用牙簽的時候你就會非常容易看到它。手指的方位,手部的動作和位置都為我們最終找到這根牙簽提供了非常重要的線索。」 同樣,為了尋找那些只有極少像素點的的面部,更大照片中的身體或者人群照片都能提供諸多線索?! τ谖⑿兔娌康奶崛碛袕V闊的應用前景,例如統(tǒng)計人群數(shù)量等等。而延伸至微型物體的需求日益突顯,就拿自動駕駛汽車來說當車速越來越快,必然需要時刻監(jiān)視和評估交通狀況,必然需要對遠處的物體進行充分且正確的識別,才能做出正確的反應?! amanan 表示通過輔助關聯(lián)信息來幫助識別對象并不是什么新鮮的概念。然而,在實際系統(tǒng)中很難去闡述和表達這種直覺。這是因為對關聯(lián)信息的編碼通常涉及到「高緯度描述」(High-Dimensional Descriptors),其中包含大量信息但是使用起來卻是非常的麻煩。他和 Hu 所研發(fā)的方法是使用了「中央凹描述」(Foveal Descriptors),模擬人類視覺結(jié)構對關聯(lián)信息進行編碼。中央凹是視網(wǎng)膜中視覺(辨色力、分辨力)最敏銳的區(qū)域,這種方法為圖片的小塊區(qū)域提供了清晰的細節(jié),而周圍區(qū)域則比較的模糊。

相關標簽
新聞分享