現(xiàn)在位置:主頁(yè) > 國(guó)內(nèi) > 騰訊優(yōu)圖亮相PRCV2020,展示人臉分析最新研究與落地成果

騰訊優(yōu)圖亮相PRCV2020,展示人臉分析最新研究與落地成果

作者:編輯 ? 時(shí)間:2020-10-21 ? 瀏覽:人次

10月16日至10月18日,由中國(guó)自動(dòng)化學(xué)會(huì) (CAA)、中國(guó)圖象圖形學(xué)學(xué)會(huì)(CSIG)、中國(guó)人工智能學(xué)會(huì)(CAAI)和中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)聯(lián)合主辦的第三屆中國(guó)模式識(shí)別與計(jì)算機(jī)視覺大會(huì)(PRCV 2020)在南京完美落幕。作為PRCV 2020特邀企業(yè)之一,騰訊優(yōu)圖實(shí)驗(yàn)室高級(jí)研究員在大會(huì)特邀企業(yè)論壇上發(fā)表了以《騰訊優(yōu)圖實(shí)驗(yàn)室近期人臉分析領(lǐng)域的研究與應(yīng)用》主題的演講,與參會(huì)專家、學(xué)者和業(yè)界代表就優(yōu)圖在人臉分析方向的研究與落地成果進(jìn)行了交流、分享。

深耕視覺AI領(lǐng)域,多項(xiàng)研究取得突破

人臉分析是人工智能的重要研究領(lǐng)域,也是騰訊優(yōu)圖的核心技術(shù)之一。在今年的ECCV中,騰訊優(yōu)圖共有8篇論文被收錄,涵蓋目標(biāo)跟蹤、行人重識(shí)別、人臉識(shí)別、人體姿態(tài)估計(jì)、動(dòng)作識(shí)別、物體檢測(cè)等熱門及前沿領(lǐng)域,再次展示了騰訊在計(jì)算機(jī)視覺領(lǐng)域的科研及創(chuàng)新實(shí)力。此次PRCV上,優(yōu)圖研究員邰穎對(duì)其中五篇論文研究成果進(jìn)行了重點(diǎn)分享。

騰訊優(yōu)圖實(shí)驗(yàn)室高級(jí)研究員邰穎現(xiàn)場(chǎng)演講

一是鏈?zhǔn)礁櫰鳎腔谀繕?biāo)對(duì)回歸的端到端聯(lián)合檢測(cè)跟蹤算法。其算法屬于業(yè)內(nèi)首創(chuàng)兩幀輸入模式,可將目標(biāo)檢測(cè)、特征提取、目標(biāo)關(guān)聯(lián)這三個(gè)模塊集成至單個(gè)網(wǎng)絡(luò)中,實(shí)現(xiàn)端到端聯(lián)合檢測(cè)跟蹤,是第一個(gè)將跟蹤算法中的目標(biāo)關(guān)聯(lián)問題轉(zhuǎn)化為兩幀檢測(cè)框?qū)Γ˙ox pair)回歸問題的算法。。

二是通過分布蒸餾損失改善人臉識(shí)別中的困難樣本。目前基于深度學(xué)習(xí)的人臉識(shí)別算法已經(jīng)可以較好的處理簡(jiǎn)單樣本,但對(duì)于困難樣本(低分辨率、大姿態(tài)等)仍表現(xiàn)不佳。為了提升人臉識(shí)別模型在困難樣本上的性能,優(yōu)圖提出了一種基于分布蒸餾的損失函數(shù)。通過分布蒸餾損失函數(shù)使Student分布靠近Teacher分布,從而減小Student分布中的同人樣本和非同人樣本的相似度重合區(qū)域,提高困難樣本的識(shí)別性能。

三是基于特征解耦的人臉活體檢測(cè)。邰穎指出,活體檢測(cè)技術(shù)用于在身份驗(yàn)證場(chǎng)景中確定對(duì)象是否為真人,以防御照片、面具、屏幕翻拍等多種方式的攻擊,保證人臉識(shí)別安全。騰訊優(yōu)圖提出了解耦學(xué)習(xí)框架,將活體特征和內(nèi)容特征通過合適的約束和監(jiān)督解耦,同時(shí)可視化了LBP紋理特征圖,進(jìn)一步促進(jìn)活體特征的解耦。

四是基于風(fēng)格跳躍連接的人臉屬性編輯,通過修改通道層面的全局信息風(fēng)格特征來解決忽略全局的人臉統(tǒng)計(jì)信息的問題。該方法可以得到在屬性生成準(zhǔn)確率和圖像質(zhì)量上都更好的結(jié)果。實(shí)驗(yàn)結(jié)果表明優(yōu)圖的算法和現(xiàn)有的所有方法相比都有優(yōu)越性。

五是基于對(duì)抗語(yǔ)義數(shù)據(jù)增強(qiáng)的人體姿態(tài)估計(jì),他認(rèn)為,目前的SOTA方法在嚴(yán)重遮擋、旁人干擾、對(duì)稱相似三種困難場(chǎng)景中表現(xiàn)仍有待提升。而優(yōu)圖提出的一種Adversarial Semantic Data Augmentation(對(duì)抗語(yǔ)義數(shù)據(jù)增強(qiáng)方法),則是針對(duì)這些人體部件在不同的細(xì)粒度上進(jìn)行重組,從而去模擬出嚴(yán)重遮擋、旁人干擾、對(duì)稱相似三種困難場(chǎng)景。而人體姿態(tài)估計(jì)網(wǎng)絡(luò)從這個(gè)對(duì)抗過程中也不斷提升了自己對(duì)困難場(chǎng)景的預(yù)測(cè)準(zhǔn)確性。

聚焦AI技術(shù)場(chǎng)景落地,不斷探索應(yīng)用新領(lǐng)域

日趨成熟的AI產(chǎn)業(yè),正在逐漸成為新一輪科技革命的核心驅(qū)動(dòng)力,讓新產(chǎn)品新技術(shù)進(jìn)步有了更大更豐富的想象空間。邰穎表示,騰訊優(yōu)圖實(shí)驗(yàn)室在研究AI技術(shù)之初,就專注于技術(shù)落地,讓技術(shù)與場(chǎng)景不斷結(jié)合碰撞。同時(shí),邰穎在現(xiàn)場(chǎng)分享了騰訊優(yōu)圖在人臉編輯生成方向的幾大創(chuàng)新實(shí)踐案例。

在人像分割和虛擬背景方面,優(yōu)圖通過二分類高精度分割能力,可將不同人種、手勢(shì)、復(fù)雜光線等不同場(chǎng)景進(jìn)行高精度分割。該技術(shù)在騰訊會(huì)議產(chǎn)品中進(jìn)行了應(yīng)用,以極小的性能消耗,保障了穩(wěn)定、精確的視頻分割效果,為聯(lián)合國(guó)大會(huì)、VALSE2020等重要會(huì)議活動(dòng)提供了支持。

在人像融合方面,優(yōu)圖依托自研的DittoGAN生成框架,在融合中更好地保持用戶的ID信息和模版屬性信息。同時(shí)還支持多樣化的模版風(fēng)格,包括真人、動(dòng)漫、游戲等。騰訊云在畢業(yè)季推出的云畢業(yè)照,以及深圳40周年的“深”份證活動(dòng)等,背后都有優(yōu)圖人像融合能力的技術(shù)支持。

在年齡演化方面,騰訊優(yōu)圖與手機(jī)QQ、騰訊微視合作推出的六一兒童節(jié)特效濾鏡,將“變童年”特效拓展至全年齡生成,并支持連續(xù)年齡演化,讓你一鍵“萌萌噠”。更有人像動(dòng)漫化能力通過騰訊云對(duì)外開放,實(shí)現(xiàn)跨領(lǐng)域等多種變化的人像轉(zhuǎn)換,為大眾帶來更有趣豐富的娛樂體驗(yàn)。

作為騰訊公司旗下人工智能實(shí)驗(yàn)室,騰訊優(yōu)圖實(shí)驗(yàn)室聚焦計(jì)算機(jī)視覺,專注人臉識(shí)別、圖像識(shí)別、OCR等領(lǐng)域開展技術(shù)研發(fā)和行業(yè)落地,在推動(dòng)產(chǎn)業(yè)數(shù)字化升級(jí)過程中,優(yōu)圖始終專注基礎(chǔ)研究、產(chǎn)業(yè)落地兩條腿走路的發(fā)展戰(zhàn)略,與騰訊云與智慧產(chǎn)業(yè)深度融合,挖掘客戶痛點(diǎn),切實(shí)為行業(yè)降本增效。在未來,騰訊優(yōu)圖也將繼續(xù)深耕于AI技術(shù),并將找到更多的應(yīng)用場(chǎng)景和應(yīng)用空間,讓更多的用戶享受到科技帶來的紅利。

轉(zhuǎn)載請(qǐng)保留原文鏈接:http://eatcooks.com/a/guona/20201021/56102.html上一篇:上一篇:看“短視頻版”世博會(huì),騰訊微視成為2020迪拜世博會(huì)中國(guó)館官方短視頻平臺(tái)
下一篇:下一篇:沒有了