現(xiàn)在位置:主頁 > 國內(nèi) > 從模型開源、到SDK開放,再到落地應用,百度開啟視覺”軟硬結(jié)合“時代

從模型開源、到SDK開放,再到落地應用,百度開啟視覺”軟硬結(jié)合“時代

作者:編輯 ? 時間:2020-09-16 ? 瀏覽:人次

?  9月15日,百度世界2020大會于線上正式召開,作為百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級別的行業(yè)盛事。本次大會以“萬物智能”為主題,吸引了眾多行業(yè)專家、技術(shù)大咖、開發(fā)者及科技愛好者的關(guān)注。

  本次大會中,百度不僅交出了一份份令人滿意的人工智能最新產(chǎn)品、技術(shù)、落地成績單,發(fā)布了多項AI革命性新品;更是向外界展示了一年來百度各個業(yè)務線所取得的巨大成果,例如百度移動生態(tài)、百度大腦最新技術(shù)產(chǎn)品獲得巨大突破;百度智能云在城市、能源、工業(yè)制造等領(lǐng)域持續(xù)落地;小度發(fā)布“破圈戰(zhàn)略”智能硬件新品;Apollo自動駕駛再取佳績......

  其中,計算機視覺作為AI技術(shù)的重要部分,在此次大會百度大腦分論壇上,也成為了百度重點分享的內(nèi)容。百度視覺技術(shù)部總監(jiān)丁二銳表示,伴隨著云化概念的深入,硬件的計算能力從云到移動端、到邊緣,算力以三個數(shù)量級的比例在下降。所以,百度重點建設并開源了模型小型化技術(shù),在有限計算資源的情況下保持算法效果不降。同時,這次還向算法開發(fā)者開源了多個性能卓越的視覺模型,向應用開發(fā)者開放了多種視頻生成SDK。

  為模型“健康瘦身” PaddleSlim助力Slim系列模型發(fā)布

  2019年,百度推出了PaddleSlim,提供量化、蒸餾、剪枝、網(wǎng)絡結(jié)構(gòu)搜索等壓縮和設計策略,同時多種策略可快速配置組合使用,幫助深度學習開發(fā)者解決了設備上內(nèi)存緊張、功耗限制、算力有限等難題。

  對于業(yè)務用戶來說,PaddleSlim提供完整的模型壓縮和設計解決方案,目前已用于圖像分類、檢測、分割等各種類型的視覺場景。而對于模型壓縮算法研究者或開發(fā)者來說,PaddleSlim提供各種壓縮和設計策略的底層輔助接口,方便用戶復現(xiàn)、調(diào)研和使用最新論文方法。

  在此次分論壇上,丁二銳除了分享了PaddleSlim的強大能力之外,還為用戶及開發(fā)者帶來了一條重磅消息——Slim系列模型開源。目前,Slim系列模型不僅包括分類和檢測等效果出眾的基礎模型,還包括業(yè)界最小的開源人臉識別和文字識別等模型。在人臉識別方向,Slim系列模型可以在效果不降的情況下,計算量只有其他開源模型的1/7。在文字識別上,最新的模型大小僅僅只有3.1M。

  值得特別提及的是,CVPR的低功耗計算視覺比賽CVPR 2020 LOW-POWER COMPUTER VISION CHALLENGE也剛剛宣布了結(jié)果,百度聯(lián)合清華大學在競爭最激烈的Real-time Image Classification Using Pixel 4 CPU 賽道中擊敗眾多強勁對手取得冠軍。本次發(fā)布的開源分類模型中就包含了此次比賽的冠軍模型。

  用技術(shù)賦予每個人獨特形象 業(yè)界首發(fā)多個人物生成SDK

  除了在端邊算法上的不斷優(yōu)化及模型壓縮解決方案的不斷完善,本次分論壇上,丁二銳還帶來了百度AI視覺領(lǐng)域的全新產(chǎn)品:業(yè)界首發(fā)終端2D虛擬真人SDK、業(yè)界首發(fā)二次元人像轉(zhuǎn)換SDK和業(yè)界首發(fā)端云一體虛擬形象構(gòu)建及應用解決方案。

  終端2D數(shù)字虛擬真人SDK,基于3D人臉建模、唇形預測、圖像融合、GAN視頻生成等技術(shù),可實現(xiàn)基于5分鐘視頻素材的低成本形象建模,支持終端的實時對話視頻生成及表情和肢體動作驅(qū)動??梢源蟠蠼档涂蛻舻馁徺I及部署成本,同時解決網(wǎng)絡依賴延遲的性能等問題;二次元人像轉(zhuǎn)換SDK,基于人臉分割、關(guān)鍵點檢測、GAN視頻生成、模型壓縮等技術(shù),支持膚色自定義調(diào)節(jié)、人像多種風格切換;而虛擬卡通人端云一體方案,具備秒級的形象生成、并可通過視覺和語音驅(qū)動,可以賦予每個人獨特形象。這些人物生成SDK,構(gòu)成了全面的能力生態(tài),可以為虛擬主播、智能化視頻生產(chǎn)提供完善的解決方案。

  端邊硬件+場景算法+PaddleSlim ,生活各個方面正經(jīng)歷“軟+硬”時代

  近年來,視覺技術(shù)已經(jīng)廣泛應用于各大領(lǐng)域,但要進一步普及,在成本控制、算法指標、持續(xù)服務和完整方案上,對廠商提出了更高的要求,目前軟硬件相結(jié)合的產(chǎn)品服務成為主流趨勢。

  作為最早的視覺軟硬一體化解決方案,百度大腦度目硬件將極具優(yōu)勢的算法模型通過嵌入式開發(fā)技術(shù)移植到端邊產(chǎn)品上,打造了人臉應用套件、人臉抓拍機、AI鏡頭模組、視頻分析盒四款民用軟硬件產(chǎn)品。軟硬結(jié)合一體化,實現(xiàn)算法與硬件的深度調(diào)優(yōu),配備預設應用,可直接部署應用及輕量級二次開發(fā)集成。

  目前,度目依靠“端邊硬件+場景算法+PaddleSlim”三位一體的強大能力,已經(jīng)在承德市30家連鎖商超進行商業(yè)分析等工作;中山市公安局鎮(zhèn)級社區(qū)門禁系統(tǒng)也通過度目實現(xiàn)了智能化升級;包括廣州某出租車營運系統(tǒng)的駕駛身份、行為識別。當PaddleSlim和其他視覺算法在硬件上結(jié)合時,也賦能了許多其他應用場景,小度在家的手勢控制;好看視頻APP的表情識別;國家電網(wǎng)智能巡檢解決方案......從智慧分析、智慧社區(qū),再到駕駛管理、產(chǎn)業(yè)賦能,百度大腦已經(jīng)打造出一個特有的“軟+硬”視覺時代,并時刻守護生活的每個角落。

  可以看到,二十年的技術(shù)積淀,近十年的 AI布局,讓百度AI前進的步伐越走越穩(wěn),也越來越快速敏捷。除了進一步開放AI能力,百度也在通過軟硬一體化等方式,降低視覺各種技術(shù)的落地門檻,讓AI技術(shù)得以延伸到更多行業(yè)場景,無論是安防、金融、交通,還是教育、酒店、零售、醫(yī)院、公寓,助力開發(fā)者繞過算法與硬件的桎梏,將更多精力放在業(yè)務開發(fā)部署上,這為產(chǎn)業(yè)智能化的進程提供了前所未有的加速度。

轉(zhuǎn)載請保留原文鏈接:http://eatcooks.com/a/guona/20200916/54405.html上一篇:上一篇:金秋九月,崇禮翠云山森林風景區(qū)金秋麓活季邀你探索別樣大森林
下一篇:下一篇:沒有了