近日,?低曆芯吭涸贙ITTI評(píng)測(cè)中排名世界第一,表明其在計(jì)算機(jī)視覺算法上取得了重大突破。在車輛檢測(cè)和車頭朝向估計(jì)兩項(xiàng)任務(wù)中,分別取得了87.27%與83.75%的AP(Average Precision)值,均排名第一。參加這項(xiàng)評(píng)測(cè)的研究機(jī)構(gòu)及高校包括百度深度學(xué)習(xí)研究院、NEC北美研究院、加州大學(xué)等世界頂級(jí)研究團(tuán)體。
KITTI是德國(guó)卡爾斯魯厄理工學(xué)院和芝加哥豐田技術(shù)研究所聯(lián)合創(chuàng)辦的一個(gè)算法評(píng)測(cè)平臺(tái),旨在評(píng)測(cè)對(duì)象(機(jī)動(dòng)車、非機(jī)動(dòng)車、行人等)檢測(cè)、目標(biāo)跟蹤等計(jì)算機(jī)視覺技術(shù)在車載環(huán)境下的性能,為機(jī)動(dòng)車輔助駕駛應(yīng)用做技術(shù)評(píng)估與技術(shù)儲(chǔ)備。
在車輛檢測(cè)這一競(jìng)賽項(xiàng)目上,要求參賽者使用計(jì)算機(jī)視覺算法檢測(cè)出由車載相機(jī)所拍攝的城市街道上的車輛,并且估算出車頭朝向。用于性能測(cè)試的KITTI數(shù)據(jù)集包含了7千多張車載圖像,單張圖像上尺度不同的車輛數(shù)目最多可達(dá)十幾輛,因此部分車輛會(huì)被其它車輛遮擋,檢測(cè)難度非常大。?低曆芯吭旱念A(yù)研團(tuán)隊(duì)基于深度學(xué)習(xí)算法,采用多任務(wù)聯(lián)合學(xué)習(xí)框架,在性能上取得了突破性進(jìn)展。
“車輛檢測(cè)算法可用于汽車的輔助駕駛系統(tǒng),為自動(dòng)駕駛技術(shù)提供支持。我們預(yù)研的檢測(cè)算法是一個(gè)通用的框架,可用于檢測(cè)任意物體,在視頻監(jiān)控及車載監(jiān)控領(lǐng)域具有廣泛的應(yīng)用價(jià)值!焙?低曆芯吭核惴A(yù)研組負(fù)責(zé)人謝迪博士說(shuō)。
“海康威視研究院的團(tuán)隊(duì)成員都是精兵強(qiáng)將。我們是一個(gè)年輕的團(tuán)隊(duì),但我們有扎實(shí)的功底和堅(jiān)定的信念。我們的目標(biāo)就是向世界頂級(jí)的研究機(jī)構(gòu)看齊,為公司的發(fā)展提供堅(jiān)強(qiáng)有力的技術(shù)支持,進(jìn)而推動(dòng)行業(yè)的發(fā)展!焙?低曆芯吭撼(wù)副院長(zhǎng)浦世亮博士說(shuō),2015年5月26日,習(xí)近平總書記蒞臨研究院,勉勵(lì)科技人員多出成果,“這給了我們極大的鼓勵(lì)!
據(jù)了解,海康威視研究院由智能分析、大數(shù)據(jù)技術(shù)、感知技術(shù)和多媒體技術(shù)等專業(yè)團(tuán)隊(duì)組成,突出在音視頻技術(shù)的專注和積累,著重研究視音頻的智能算法、大數(shù)據(jù)的分析、挖掘和計(jì)算,同時(shí)針對(duì)新的圖像傳感器等感知技術(shù),視頻的播放技術(shù),人機(jī)交互等多媒體技術(shù)進(jìn)行深入研究。目前在?低曆芯吭罕姸囝I(lǐng)域的研究都走在行業(yè)前列。
http://www.cvlibs.net/datasets/kitti/eval_object.php
下圖為車輛檢測(cè)排名結(jié)果
下圖為車輛朝向估計(jì)排名結(jié)果
|