影像資料顯示人戴了口罩和帽子,且周圍光線黑暗
同樣是人機(jī)大戰(zhàn),同樣是機(jī)器戰(zhàn)勝人類,為什么AlphaGo取得了震驚世界的效果,而小度卻不斷被質(zhì)疑?其中一個(gè)很重要的原因就是播出方式不一樣,即使具備科學(xué)屬性,《強(qiáng)大腦》也不過(guò)只是一檔綜藝節(jié)目,經(jīng)過(guò)后期制作,播出的效果遠(yuǎn)沒(méi)有直播帶來(lái)的震撼性和真實(shí)性。
而事實(shí)到底是怎樣的,我們也不得而知,這也不是我們今天討論的重點(diǎn)(感興趣的朋友可以上網(wǎng)搜索,網(wǎng)友和百度都給出了相關(guān)的說(shuō)明)。我們今天要說(shuō)的是,百度自稱在人臉識(shí)別算法國(guó)內(nèi)第一,有效的依據(jù)是什么?以及,在安防領(lǐng)域,人臉識(shí)別技術(shù)已經(jīng)達(dá)到了何種程度。
LFW和FDDB的排名有意義嗎
相信對(duì)人臉識(shí)別算法有研究的同學(xué)對(duì)LFW和FDDB也有一定的了解。LFW(Labeled Faces in the Wild)和FDDB(Face Detection Data Set and Benchmark)是全球權(quán)威的人臉識(shí)別檢測(cè)平臺(tái),做人臉識(shí)別算法的公司,多多少少地會(huì)到LFW和FDDB上進(jìn)行檢測(cè)。
LFW數(shù)據(jù)庫(kù)共有5749個(gè)人的13233幅圖像,其中1680人有兩幅及以上的圖像,4069人只有一幅圖像。FDDB和LFW一樣,都是馬薩諸塞大學(xué)的人臉數(shù)據(jù)庫(kù),它包含2845張圖片,共有5171個(gè)人臉作為測(cè)試集。測(cè)試集范圍包括:不同姿勢(shì)、不同分辨率、旋轉(zhuǎn)和遮擋等圖片。
百度自稱人臉識(shí)別算法第一是因?yàn)椋?015年,百度在LFW中曾達(dá)到99.77%的準(zhǔn)確率,排名第一。而在2016年,小米和大華分別在FDDB和LFW數(shù)據(jù)集上拿下了第一的成績(jī)。
LFW和FDDB的權(quán)威性不容置疑,但是值得說(shuō)明的是,由于LFW和FDDB的樣本是固定的,相當(dāng)于一場(chǎng)考試,你已經(jīng)知道了題目,然后不停改進(jìn)你的答案,這樣的刷分是沒(méi)有多大意義的。
安防領(lǐng)域的人臉識(shí)別有多大能耐
當(dāng)我們談到人臉識(shí)別時(shí),會(huì)出現(xiàn)兩個(gè)常見和重要的概念,即1:1和1:N。
簡(jiǎn)單說(shuō)來(lái),1:1是一對(duì)一的人臉“核對(duì)”,解決的是“這個(gè)人是不是你”的問(wèn)題,1:N是從眾多對(duì)象中找出目標(biāo)人物,解決的是“這個(gè)人是誰(shuí)”的問(wèn)題。
人臉識(shí)別考勤、安檢時(shí)的身份驗(yàn)證等應(yīng)用都是1:1概念下的人臉識(shí)別應(yīng)用。
而1:N更多的是用于安防行業(yè),比如在人流密集的場(chǎng)所安裝人臉識(shí)別防控系統(tǒng),它和1:1大的區(qū)別就是1:N采集的是動(dòng)態(tài)的數(shù)據(jù),并且會(huì)因?yàn)榈攸c(diǎn)、環(huán)境、光線等影響識(shí)別的準(zhǔn)確性和效果。
一套基本的人臉識(shí)別布控系統(tǒng)會(huì)具備以下幾個(gè)功能:
(1)人臉捕獲與跟蹤功能
人臉捕獲是指在一幅圖像或視頻流的一幀中檢測(cè)出人像并將人像從背景中分離出來(lái),并自動(dòng)地將其保存。人像跟蹤是指利用人像捕獲技術(shù),當(dāng)指定的人像在攝像頭拍攝的范圍內(nèi)移動(dòng)時(shí)自動(dòng)地對(duì)其進(jìn)行跟蹤。
(2)人臉識(shí)別計(jì)算
人臉識(shí)別分核實(shí)式和搜索式二種比對(duì)計(jì)算模式。核實(shí)式是對(duì)指將捕獲得到的人像或是指定的人像與數(shù)據(jù)庫(kù)中已登記的某一對(duì)像作比對(duì)核實(shí)確定其是否為同一人。搜索式的比對(duì)是指從數(shù)據(jù)庫(kù)中已登記的所有人像中搜索查找是否有指定的人像存在。
(3)人臉的建模與檢索
可以將登記入庫(kù)的人像數(shù)據(jù)進(jìn)行建模提取人臉的特征,并將其生成人臉模板保存到數(shù)據(jù)庫(kù)中。在進(jìn)行人臉?biāo)阉鲿r(shí),將指定的人像進(jìn)行建模,再將其與數(shù)據(jù)庫(kù)中的所有人的模板相比對(duì)識(shí)別,終將根據(jù)所比對(duì)的相似值列出相似的人員列表。
因此,數(shù)據(jù)成為提升人臉識(shí)別算法性能的關(guān)鍵因素,很多應(yīng)用更加關(guān)注低誤報(bào)條件下的識(shí)別性能,比如支人臉支付需要控制錯(cuò)誤接受率在0.00001之內(nèi),因此以后的算法改進(jìn)也將著重于提升低誤報(bào)下的識(shí)別率。對(duì)于安防監(jiān)控而言,可能需要控制在0.00000001之內(nèi)(比如幾十萬(wàn)人的注冊(cè)庫(kù)),安防領(lǐng)域的人臉識(shí)別技術(shù)更具有挑戰(zhàn)性。
而隨著深度學(xué)習(xí)演進(jìn),基于深度學(xué)習(xí)的人臉識(shí)別將獲得突破性的進(jìn)展。它需要的只是越來(lái)越多的數(shù)據(jù)和樣本,數(shù)據(jù)和樣本越多、反復(fù)訓(xùn)練的次數(shù)越多,它越容易捕捉到準(zhǔn)確的結(jié)果和給你準(zhǔn)確的答案。所以,當(dāng)一套人臉識(shí)別系統(tǒng)的設(shè)備,在全面引入深度學(xué)習(xí)的算法之后,它幾乎是很完美的解決了以前長(zhǎng)期各種各樣的變化問(wèn)題。
但即便如此,人臉識(shí)別技術(shù)依然面臨實(shí)際應(yīng)用等諸多挑戰(zhàn),如何在各種復(fù)雜的場(chǎng)景中得到成功的應(yīng)用還需要眾多的安防廠商共同努力。
官方微博
官方微信公眾號(hào)
官方百家號(hào)