好未來(lái)技術(shù)獲獎(jiǎng)
多知網(wǎng)6月28日消息,CVPR 2021(Computer Vision and Pattern Recognition,計(jì)算機(jī)視覺(jué)與模式識(shí)別國(guó)際頂級(jí)會(huì)議)的各項(xiàng)挑戰(zhàn)賽結(jié)果近日正式出爐。
好未來(lái)AI研究院在Person In Context 挑戰(zhàn)賽(Human-Object-Interaction Detection賽道)、UG²+挑戰(zhàn)賽(Superviced Face Detection In Low Light Conditions賽道)、Gaze Estimation and Prediction in the wild 挑戰(zhàn)賽(ETH-XGaze賽道)和ActivityNet 挑戰(zhàn)賽(Active Speaker Detection賽道)等重要賽事中,擊敗國(guó)內(nèi)外眾多科技巨頭和知名高校,共獲得4項(xiàng)國(guó)際冠軍,并受邀出席會(huì)議作報(bào)告分享,這標(biāo)志著中國(guó)科技教育企業(yè)研發(fā)的視覺(jué)算法技術(shù)已處于國(guó)際一流水平。
這是好未來(lái)獲得CVPR2020的EmotioNet人臉表情識(shí)別競(jìng)賽冠軍后,再次在該國(guó)際技術(shù)賽場(chǎng)上獲得佳績(jī)。CVPR由IEEE(電氣與電子工程師協(xié)會(huì))舉辦,是計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域最具影響力、內(nèi)容最全面的頂級(jí)A類(lèi)學(xué)術(shù)會(huì)議,好未來(lái)此次參賽的前沿技術(shù)包括暗光下人臉檢測(cè)、人/物關(guān)系檢測(cè)、視線(xiàn)估計(jì)、說(shuō)話(huà)人檢測(cè)等。
其中Person In Context 挑戰(zhàn)賽由北京航空航天大學(xué)、浙江大學(xué)等國(guó)內(nèi)外高校舉辦,吸引了曠視、百度等公司和研究機(jī)構(gòu)參賽。人/物關(guān)系檢測(cè)任務(wù)目標(biāo)是輸出多個(gè)三元組,包含了人的坐標(biāo)框、物體的坐標(biāo)框、人/物關(guān)系。該技術(shù)是面向以人為中心場(chǎng)景下高級(jí)語(yǔ)義理解的重要一步,具有廣泛的應(yīng)用場(chǎng)景,例如行為分析、人機(jī)交互以及智能監(jiān)控等。
好未來(lái)在該競(jìng)賽中提出了結(jié)合人體關(guān)鍵點(diǎn)信息的圖網(wǎng)絡(luò)方法進(jìn)行關(guān)系的推理,并在網(wǎng)絡(luò)中融合Transformer模塊進(jìn)行特征的增強(qiáng),使最終端到端的結(jié)果得到了明顯的提升,以mAP 95.5的絕對(duì)優(yōu)勢(shì)奪魁。上述技術(shù)已應(yīng)用于好未來(lái)的教學(xué)質(zhì)量評(píng)估系統(tǒng),為改善老師授課質(zhì)量提供重要的數(shù)據(jù)分析。
Person In Context,人/物關(guān)系檢測(cè)賽道最終榜單
在無(wú)約束、動(dòng)態(tài)退化的環(huán)境中(如惡劣天氣和光照條件等),視覺(jué)感知和理解算法的性能會(huì)受較大影響,UG²+挑戰(zhàn)賽旨在通過(guò)應(yīng)用圖像恢復(fù)和增強(qiáng)算法來(lái)提高分析性能,從而推進(jìn)對(duì)“困難”圖像的分析。其中暗光人臉檢測(cè)賽道重點(diǎn)解決人臉檢測(cè)算法在暗光環(huán)境下檢測(cè)效果下降的問(wèn)題,該項(xiàng)技術(shù)對(duì)解決學(xué)生視力保護(hù)的問(wèn)題有重大意義。
由于在暗光環(huán)境下人臉的視覺(jué)特征相較正常環(huán)境下差異巨大,使用現(xiàn)有人臉檢測(cè)算法不能有效工作,對(duì)檢測(cè)算法與研究人員都有很大的挑戰(zhàn)。
為了應(yīng)對(duì)這些問(wèn)題,好未來(lái)結(jié)合了傳統(tǒng)方法和深度學(xué)習(xí)方法的“去黑暗化”的數(shù)據(jù)處理方案。此外還利用一系列的圖像處理技術(shù)與GAN技術(shù),將正常的圖像(來(lái)自于Widerface, UFDD)先“變暗后變亮再加噪聲“,得到與黑暗圖像變亮效果類(lèi)似的圖像,實(shí)現(xiàn)正常圖片的“域”遷移。好未來(lái)以多種技術(shù)方法的有效結(jié)合,最終以領(lǐng)先第二名超過(guò)3%的mAP奪冠。
UG2+,人臉暗光檢測(cè)賽道最終榜單
人的視線(xiàn)估計(jì)在人機(jī)交互、情感計(jì)算和醫(yī)學(xué)診斷等許多應(yīng)用領(lǐng)域中起著基礎(chǔ)性的作用,尤其在教育場(chǎng)景中,視線(xiàn)的關(guān)注點(diǎn)直接與學(xué)生聽(tīng)課的關(guān)注度相關(guān)。對(duì)于一張給定的包含面部的圖像數(shù)據(jù),ETH-XGaze挑戰(zhàn)賽要求參賽隊(duì)伍分析圖片中人物的眼睛信息,精確計(jì)算出圖片中視線(xiàn)的偏移角度。該挑戰(zhàn)賽發(fā)布的數(shù)據(jù)集由超過(guò)一百萬(wàn)張?jiān)跇O端頭部姿勢(shì)下不同凝視的高分辨率圖像組成,包含了110名參與者在18個(gè)數(shù)碼單反相機(jī)和可調(diào)節(jié)的照明條件的下的視線(xiàn)圖像,吸引了華為、中國(guó)科學(xué)技術(shù)大學(xué)等數(shù)十支隊(duì)伍參與。
好未來(lái)與中科院計(jì)算所聯(lián)合摘桂,雙方將先進(jìn)技術(shù)與實(shí)際業(yè)務(wù)經(jīng)驗(yàn)相結(jié)合,采用注意力機(jī)制將眼睛的局部特征和臉部的全局特征相結(jié)合,有效提高了回歸模型的精度。據(jù)悉,該項(xiàng)技術(shù)已經(jīng)應(yīng)用在學(xué)而思網(wǎng)校的授課系統(tǒng)中,并在好未來(lái)AI開(kāi)放平臺(tái)上線(xiàn)。
ETH-XGaze競(jìng)賽冠軍頁(yè)面
ActivityNet是目前視頻理解領(lǐng)域影響力最大的賽事之一,其中Active Speaker賽道任務(wù)目標(biāo)是對(duì)視頻中的可見(jiàn)人物是否在說(shuō)話(huà)進(jìn)行精確地判斷,該項(xiàng)技術(shù)對(duì)于網(wǎng)課教學(xué)中判斷和提升學(xué)生互動(dòng)的效果頗好。好未來(lái)與中科院計(jì)算所聯(lián)隊(duì)在未采用任何預(yù)訓(xùn)練的情況下,取得了93.44 mAP的指標(biāo),戰(zhàn)勝了慕尼黑工業(yè)大學(xué)、微軟、新加坡國(guó)立大學(xué)等眾多強(qiáng)隊(duì)。
ActivityNet, active speaker賽道冠軍頁(yè)面
好未來(lái)AI研究院是國(guó)內(nèi)教育領(lǐng)域較早進(jìn)行AI技術(shù)研究與落地探索的研究機(jī)構(gòu),經(jīng)過(guò)近5年的積累,取得許多前沿核心技術(shù)突破,涉及圖像與視頻理解、機(jī)器學(xué)習(xí)、自然語(yǔ)言理解、語(yǔ)音合成與評(píng)測(cè)等多個(gè)領(lǐng)域,面向行業(yè)開(kāi)放了視覺(jué)、語(yǔ)音、NLP和數(shù)據(jù)挖掘等領(lǐng)域的170余項(xiàng)AI能力,提供互動(dòng)評(píng)測(cè)、練習(xí)批改、內(nèi)容生產(chǎn)和教學(xué)管理等方面的定制化AI解決方案,累計(jì)獲得包括UbiComp2020競(jìng)賽、NeurIPS2020“教育挑戰(zhàn)”競(jìng)賽、CCL 2020幽默計(jì)算評(píng)測(cè)、INTERSPEECH 2021“非母語(yǔ)兒童識(shí)別“競(jìng)賽在內(nèi)的十余項(xiàng)國(guó)內(nèi)外競(jìng)賽冠軍,發(fā)表60多篇高水平學(xué)術(shù)論文、已申請(qǐng)100余項(xiàng)專(zhuān)利。
好未來(lái)是智慧教育國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)承建單位,近日與智源研究院深度攜手,成為悟道生態(tài)戰(zhàn)略合作伙伴,加速在智慧課堂、教師輔助、智慧學(xué)伴、教育智能硬件、自適應(yīng)學(xué)習(xí)等領(lǐng)域的探索落地,共同推進(jìn)教育行業(yè)智能化升級(jí)與數(shù)字化轉(zhuǎn)型。