現(xiàn)在位置:主頁 > 國內 > 搜狗搜索榮獲MIND新聞推薦競賽冠軍

搜狗搜索榮獲MIND新聞推薦競賽冠軍

作者:編輯 ? 時間:2020-10-10 ? 瀏覽:人次

近日,搜狗搜索在由微軟亞洲研究院和微軟新聞產(chǎn)品團隊聯(lián)合舉辦的“MIND新聞推薦比賽”中技壓群雄,擊敗來自加拿大、法國、韓國等全球各地的技術團隊,榮獲國際比賽第一名。

圖片:比賽官網(wǎng)截圖

眾所周知,推薦技術在新聞資訊今日頭條,短視頻抖音,快手,商品推薦淘寶等領域取得了巨大的成功,得到了工業(yè)界和學術界的廣泛關注。與產(chǎn)品推薦、電影推薦或是餐廳推薦領域通常有一些公認的基準數(shù)據(jù)集不同,在新聞推薦領域,高質量的基準數(shù)據(jù)集比較匱乏,一定程度阻礙和制約了這一領域的深入研究。

為此,微軟亞洲研究院聯(lián)合微軟新聞產(chǎn)品團隊在ACL 2020上發(fā)布了規(guī)模最大的英文新聞推薦數(shù)據(jù)集MIND,并舉辦了 MIND 新聞推薦比賽。此次的比賽正是基于MIND新聞推薦數(shù)據(jù)集展開,在全球范圍內征集最優(yōu)秀的個性化新聞推薦解決方案,更好地推動新聞推薦領域的技術發(fā)展,以改善用戶的新聞閱讀體驗。

而作為本次國際比賽的冠軍隊伍,搜狗搜索在本次競賽中再次彰顯出了專業(yè)的技術實力。憑借著自身在搜索領域和推薦算法方面多年的技術深耕和積累,搜狗搜索在本次比賽中采用了多角度信息綜合建模的方案,單一模型通過融合多個降采樣數(shù)據(jù)集取得較好效果。搜狗搜索提供的解決方案各項指標數(shù)據(jù)均領先,最終在本次國際競賽中奪冠。

具體而言,在數(shù)據(jù)處理方面,針對正負樣本不平衡,正樣本率只有4的情況,搜狗搜索做了1/5負樣本降采樣,并由此構建了5份不同數(shù)據(jù)集負樣本不同,有效節(jié)約了單模型訓練時間,并且單模型效果和使用全量數(shù)據(jù)相比并沒有明顯效果衰減。除此之外,在文本建模方面,利用BERT的BPR分詞器,采用文檔內部詞匯Attention,文檔間利用要預測的目標新聞進行Attention綜合建模。最后,通過DNN+DIN注意力機制+DLRM特征交叉的結合進行多角度特征融合,包括用戶ID、文檔ID、類別、實體、標題、摘要和正文特征等,對多角度信息進行有效融合,使得新聞推薦做到更加精準和個性化。更值得一提的是,搜狗搜索的這些領先技術目前已在包括搜狗搜索APP、搜狗手機瀏覽器等多款產(chǎn)品中落地應用。

圖片:技術原理示意

作為連接人、服務,信息甚至是知識之間的橋梁,搜索技術和推薦技術應用場景雖有差異,但是背后的技術有很大的關聯(lián)。搜狗搜索作為國內領先的搜索引擎,在推薦技術和搜索技術有長足的積累和領先優(yōu)勢,才使得搜狗搜索能在與世界各地的技術團隊競賽較量中脫穎而出,一舉奪冠。

轉載請保留原文鏈接:http://eatcooks.com/a/guona/20201010/55577.html上一篇:上一篇:訂單量漲超10倍,鹵味巨頭留夫鴨、久久丫上支付寶一“搜”成名
下一篇:下一篇:沒有了