以深度學(xué)習(xí)為代表的人工智能在圖像、語(yǔ)音和 NLP 領(lǐng)域帶來(lái)了突破性的進(jìn)展,在信息檢索和個(gè)性化領(lǐng)域近幾年也有不少公開(kāi)文獻(xiàn),比如 wide & deep 實(shí)現(xiàn)了深度模型和淺層模型的結(jié)合,dssm 用于計(jì)算語(yǔ)義相關(guān)性,deepfm 增加了特征組合的能力,deep CF 用深度學(xué)習(xí)實(shí)現(xiàn)協(xié)同過(guò)濾,rnn recommender 采用行為序列預(yù)估實(shí)現(xiàn)個(gè)性化推薦等。工業(yè)級(jí)的信息檢索或個(gè)性化系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng)工程,深度學(xué)習(xí)的工業(yè)級(jí)應(yīng)用需要具備三個(gè)條件:強(qiáng)大的系統(tǒng)計(jì)算能力,優(yōu)秀的模型設(shè)計(jì)能力和合適的應(yīng)用場(chǎng)景,我們梳理了過(guò)去一年多搜索在深度學(xué)習(xí)方向上的探索,概要的介紹了我們?cè)谏疃葘W(xué)習(xí)系統(tǒng)、深度學(xué)習(xí)算法和搜索應(yīng)用落地的進(jìn)展和思考,希望對(duì)大家有所啟發(fā)。
深度學(xué)習(xí)在搜索的應(yīng)用概括起來(lái)包括 4 個(gè)方面:
首先是系統(tǒng),強(qiáng)大的深度學(xué)習(xí)訓(xùn)練平臺(tái)和在線預(yù)測(cè)系統(tǒng)是深度學(xué)習(xí)應(yīng)用的必要條件,目前我們的離線深度學(xué)習(xí)框架、在線深度學(xué)習(xí)框架和在線預(yù)測(cè)框架統(tǒng)一到 tf,并實(shí)現(xiàn)了日志處理,特征抽取,模型訓(xùn)練和在線服務(wù)部署端到端的流程,極大提升了算法迭代效率;
其次是搜索應(yīng)用,包括智能交互,語(yǔ)義搜索,智能匹配和智能決策四個(gè)技術(shù)方向,這四個(gè)方向的協(xié)同創(chuàng)新實(shí)現(xiàn)了搜索全鏈路的深度學(xué)習(xí)技術(shù)升級(jí),并具備從傳統(tǒng)的單場(chǎng)景單目標(biāo)優(yōu)化到多場(chǎng)景多目標(biāo)聯(lián)合優(yōu)化的能力;
再次是在性能優(yōu)化上做的工作,包括模型壓縮、量化、低秩分解再到二值網(wǎng)絡(luò),大量的技術(shù)調(diào)研和論證,為未來(lái)提高深度模型預(yù)測(cè)性能和軟硬件協(xié)同優(yōu)化做了很好的技術(shù)鋪墊;
最后是排序平臺(tái)化,實(shí)現(xiàn)了 PC 商品搜索、無(wú)線商品搜索、店鋪內(nèi)搜索搜索和店鋪搜索的搜索服務(wù)統(tǒng)一,通過(guò)特征和模型復(fù)用,實(shí)現(xiàn)了多條業(yè)務(wù)線技術(shù)的快速升級(jí)。下面我會(huì)簡(jiǎn)要的概括下在四個(gè)方向上取得的主要進(jìn)展和背后的思考。
下面是搜索系統(tǒng)和算法的簡(jiǎn)圖。系統(tǒng)包括:
a. 離線數(shù)據(jù)平臺(tái) ODPS,負(fù)責(zé)離線日志 join、特征抽取和離線模型預(yù)估產(chǎn)出排序特征,時(shí)效性不強(qiáng)的特征都是通過(guò)離線數(shù)據(jù)平臺(tái)產(chǎn)出的,比如用戶性別標(biāo)簽,商品關(guān)鍵字等;
b. 離線機(jī)器學(xué)習(xí)平臺(tái) PAI,底層是主流的 parameter server 和 TF 深度學(xué)習(xí)框架,平臺(tái)實(shí)現(xiàn)了大部分機(jī)器學(xué)習(xí)算法模型的并行訓(xùn)練和預(yù)測(cè),在搜索應(yīng)用中主要作用是離線模型訓(xùn)練產(chǎn)出離線排序特征模型;
c. 流式計(jì)算和在線學(xué)習(xí)平臺(tái) Porsche,流式計(jì)算是基于 blink 負(fù)責(zé)實(shí)時(shí)日志解析和特征 join 生成實(shí)時(shí)排序特征,在線學(xué)習(xí)和離線學(xué)習(xí)底層框架可以相同,差別主要是依賴數(shù)據(jù)源和部分優(yōu)化方法不同,由于用戶行為和市場(chǎng)環(huán)境變化快,流式計(jì)算和在線學(xué)習(xí)在搜索應(yīng)用非常廣泛,并積累了不少在線學(xué)習(xí)和強(qiáng)化學(xué)習(xí)算法;
d. 在線服務(wù)平臺(tái),包括引擎、排序服務(wù)和搜索平臺(tái)組成,負(fù)責(zé)在線的服務(wù)分發(fā)、索引查詢、排序服務(wù)和結(jié)果合并等功能,搜索的排序策略、相關(guān)性、個(gè)性化等模型主要通過(guò)在線預(yù)測(cè)服務(wù)生效。經(jīng)過(guò)多年發(fā)展我們已經(jīng)具備了非常完善的商品搜索排序算法體系,包括知識(shí)圖譜、分詞、tagging、類目預(yù)測(cè)、意圖預(yù)測(cè)、拼寫糾錯(cuò)、query 推薦、query 語(yǔ)義改寫、相關(guān)性、商品標(biāo)簽、商品質(zhì)量、店鋪分層、用戶 profile、用戶偏好、用戶感知、召回策略、個(gè)性化模型、多樣性策略、異構(gòu)服務(wù)混排策略、多目標(biāo)聯(lián)合優(yōu)化策略、多場(chǎng)景聯(lián)合排序策略等,并平臺(tái)化的方式賦能相關(guān)業(yè)務(wù)團(tuán)隊(duì)。
系統(tǒng)進(jìn)展包括機(jī)器學(xué)習(xí)平臺(tái)和在線預(yù)測(cè)平臺(tái)
機(jī)器學(xué)習(xí)平臺(tái)。搜索訓(xùn)練樣本主要來(lái)自用戶行為,由于用戶行為是流式數(shù)據(jù),適合做在線深度學(xué)習(xí),但當(dāng)模型參數(shù)非常龐大需要海量的樣本時(shí)在線學(xué)習(xí)需要很長(zhǎng)的時(shí)間才能收斂,這時(shí)一般是先做離線預(yù)訓(xùn)練再結(jié)合增量或在線學(xué)習(xí),另外有些模型離線預(yù)訓(xùn)練后在線只需要對(duì)接近輸出層的網(wǎng)絡(luò)做 fine-tuning。搜索在實(shí)際應(yīng)用的有離線機(jī)器學(xué)習(xí)平臺(tái) PAI 和在線機(jī)器學(xué)習(xí)平臺(tái) Porsche,兩個(gè)平臺(tái)深度學(xué)習(xí)框架目前都統(tǒng)一到了 tf-pai,tf-pai 對(duì)原生 tf 做了一些優(yōu)化,比如底層通訊,稀疏參數(shù)存儲(chǔ)、優(yōu)化方法、GPU 顯存優(yōu)化等,比原生 tf 訓(xùn)練深度有較大的提升,訓(xùn)練上千億樣本和上百億參數(shù)的深度模型毫無(wú)壓力。雖然 Porsche 和 PAI 都支持 GPU,但在搜索應(yīng)用中 CPU 依然是主流,GPU 應(yīng)用比較少,原因主要是個(gè)性化相對(duì)圖像或語(yǔ)音簡(jiǎn)單,特征抽取網(wǎng)絡(luò)比較淺,維度相對(duì)較低,GPU 的稠密矩陣計(jì)算能力得不到充分發(fā)揮,同時(shí)離在線混布后流量低谷期間騰出了大量的在線服務(wù)閑置 CPU,把臨時(shí)閑置的 CPU 利用起來(lái)做深度學(xué)習(xí)訓(xùn)練是一個(gè)非常好的思路。
在線預(yù)估 RTP,搜索排序算分服務(wù)。由于每次搜索請(qǐng)求有上千個(gè)商品需要計(jì)算排序分?jǐn)?shù),深度模型應(yīng)用對(duì) RTP 服務(wù)的壓力是非常大的,RTP 通過(guò)采用異構(gòu)計(jì)算,計(jì)算算子化和模型分片等方式解決了深度模型 inference 計(jì)算和存儲(chǔ)問(wèn)題,深度模型用 GPU,淺層模型用 CPU,今年雙 11 期間搜索 RTP 服務(wù)用到了 550 張 GPU 卡。另外,RTP 還實(shí)現(xiàn)了離線/在線訓(xùn)練模型/數(shù)據(jù)和在線預(yù)測(cè)服務(wù)部署的無(wú)縫銜接,算法訓(xùn)練好的模型或數(shù)據(jù)可以很輕松的部署都在線服務(wù),提升了算法迭代效率。
算法包括智能交互、語(yǔ)義搜索、智能匹配和搜索策略四個(gè)方向
智能交互。商品搜索就是帶交互的商品推薦,用戶通過(guò)關(guān)鍵字輸入搜索意圖,引擎返回和搜索意圖匹配的個(gè)性化推薦結(jié)果,好的交互技術(shù)能夠幫助到用戶更好的使用搜索引擎,目前搜索的交互主要是主動(dòng)關(guān)鍵字輸入和關(guān)鍵字推薦,比如搜索框中的默認(rèn)查詢?cè)~和搜索結(jié)果中的文字鏈等,推薦引擎根據(jù)用戶搜索歷史、上下文、行為和狀態(tài)推薦關(guān)鍵字。
和商品推薦的區(qū)別是,關(guān)鍵字推薦是搜索鏈路的中間環(huán)節(jié),關(guān)鍵字推薦的收益除了關(guān)鍵字的點(diǎn)擊行為外,還需要考慮對(duì)整個(gè)購(gòu)物鏈路的影響,包括在推薦關(guān)鍵字的后續(xù)行為中是否有商品點(diǎn)擊、加購(gòu)和成交或跳轉(zhuǎn)到另外一個(gè)關(guān)鍵字的后繼行為,這是一個(gè)典型的強(qiáng)化學(xué)習(xí)問(wèn)題,action 是推薦的關(guān)鍵字候選集合,狀態(tài)是用戶當(dāng)前搜索關(guān)鍵詞、上下文等,收益是搜索引導(dǎo)的成交。除了被動(dòng)的關(guān)鍵字推薦,我們也在思考搜索中更加主動(dòng)的交互方式,能夠做到像導(dǎo)購(gòu)員一樣的雙向互動(dòng),主動(dòng)詢問(wèn)用戶需求,挑選個(gè)性化的商品和給出個(gè)性化的推薦理由,目前阿里搜索團(tuán)隊(duì)已經(jīng)在做智能導(dǎo)購(gòu)和智能內(nèi)容方向的技術(shù)原型及論證,智能導(dǎo)購(gòu)在技術(shù)上主要是借鑒對(duì)話系統(tǒng),通過(guò)引導(dǎo)用戶和引擎對(duì)話與關(guān)鍵字推薦方式互為補(bǔ)充,包括自然語(yǔ)言理解,對(duì)話策略,對(duì)話生成,知識(shí)推理、知識(shí)問(wèn)答和商品搜索等模塊,功能主要包括:
a. 根據(jù)用戶搜索上下文生成引導(dǎo)用戶主動(dòng)交互的文本,比如搜索「奶粉」時(shí),會(huì)生成「您寶寶多大?0~6 個(gè)月,6 個(gè)月到 1 歲….」引導(dǎo)文案,提示用戶細(xì)化搜索意圖,如果用戶輸入「3 個(gè)月」后,會(huì)召回相應(yīng)段位的奶粉,并在后續(xù)的搜索中會(huì)記住對(duì)話狀態(tài)「3 個(gè)月」寶寶和提示用戶「以下是適合 3 個(gè)月寶寶的奶粉」。
b. 知識(shí)導(dǎo)購(gòu),包含提高售前知識(shí)問(wèn)答或知識(shí)提示,比如「3 個(gè)月寶寶吃什么奶粉」回答「1 段」。目前對(duì)話技術(shù)正在提高中,尤其是在多輪對(duì)話狀態(tài)跟蹤、知識(shí)問(wèn)答和自動(dòng)評(píng)價(jià)幾個(gè)方面,但隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和生成對(duì)抗學(xué)習(xí)等技術(shù)在 NLP、對(duì)話策略、閱讀理解等領(lǐng)域的應(yīng)用,越來(lái)越多的訓(xùn)練數(shù)據(jù)和應(yīng)用場(chǎng)景,domain specific 的對(duì)話技術(shù)未來(lái)幾年應(yīng)該會(huì)突飛猛進(jìn)。智能內(nèi)容生成,包括生成或輔助人工生成商品和清單的「賣點(diǎn)」,短標(biāo)題和文本摘要等,讓淘寶商品表達(dá)更加個(gè)性化和多元化。
語(yǔ)義搜索。語(yǔ)義搜索主要是解決關(guān)鍵字和商品內(nèi)容之間的語(yǔ)義鴻溝,比如搜索「2~3 周歲寶寶外套」,如果按照關(guān)鍵字匹配召回結(jié)果會(huì)遠(yuǎn)小于實(shí)際語(yǔ)義匹配的商品。
多智能體協(xié)同學(xué)習(xí)實(shí)現(xiàn)智能決策
搜索中個(gè)性化產(chǎn)品都是成交最大化,導(dǎo)致的問(wèn)題是搜索結(jié)果趨同,浪費(fèi)曝光,今年做的一個(gè)重要工作是利用多智能體協(xié)同學(xué)習(xí)技術(shù),實(shí)現(xiàn)了搜索多個(gè)異構(gòu)場(chǎng)景間的環(huán)境感知、場(chǎng)景通信、單獨(dú)決策和聯(lián)合學(xué)習(xí),實(shí)現(xiàn)聯(lián)合收益最大化,而不是此消彼長(zhǎng),在今年雙 11 中聯(lián)合優(yōu)化版本帶來(lái)的店鋪內(nèi)和無(wú)線搜索綜合指標(biāo)提升 12% (AB-Test),比非聯(lián)合優(yōu)化版本高 3% (AB-Test)。
性能優(yōu)化。在深度學(xué)習(xí)剛起步的時(shí)候,我們意識(shí)到深度模型 inference 性能會(huì)是一個(gè)瓶頸,所以在這方面做了大量的調(diào)研和實(shí)驗(yàn),包括模型壓縮 (剪枝),低秩分解,量化和二值網(wǎng)絡(luò)。
通過(guò)以上技術(shù),今年雙 11 期間在手淘默認(rèn)搜索、店鋪內(nèi)搜索、店鋪搜索等均取得了 10% (AB-Test) 以上的搜索指標(biāo)提升。
阿里巴巴人工智能搜索應(yīng)用的未來(lái)計(jì)劃
通用用戶表征學(xué)習(xí)。前面介紹的 DUPN 是一個(gè)非常不錯(cuò)的用戶表征學(xué)習(xí)模型,但基于 query 的 attention 只適合搜索,同時(shí)缺少基于日志來(lái)源的 attention,難以推廣到其他業(yè)務(wù),在思考做一個(gè)能夠適合多個(gè)業(yè)務(wù)場(chǎng)景的用戶表征模型,非搜索業(yè)務(wù)做些簡(jiǎn)單 fine tuning 就能取得比較好的效果;同時(shí)用戶購(gòu)物偏好受季節(jié)和周期等影響,時(shí)間跨度非常大,最近 K 個(gè)行為序列假設(shè)太簡(jiǎn)單,我們?cè)谒伎寄軌蜃?life-long learning 的模型,能夠?qū)W習(xí)用戶過(guò)去幾年的行為序列;
搜索鏈路聯(lián)合優(yōu)化。從用戶進(jìn)入搜索到離開(kāi)搜索鏈路中的整體優(yōu)化,比如 搜索前的 query 引導(dǎo)(底紋),搜索中的商品和內(nèi)容排序,搜索后的 query 推薦(錦囊)等場(chǎng)景;
跨場(chǎng)景聯(lián)合優(yōu)化。今年搜索內(nèi)部主搜索和店鋪內(nèi)搜索聯(lián)合優(yōu)化取得了很好的結(jié)果,未來(lái)希望能夠拓展在更多大流量場(chǎng)景,提高手淘的整體購(gòu)物體驗(yàn);
多目標(biāo)聯(lián)合優(yōu)化。搜索除了成交外,還需要承擔(dān)賣家多樣性,流量公平性,流量商業(yè)化等居多平臺(tái)和賣家的訴求,搜索產(chǎn)品中除了商品搜索外還有「穹頂」,「主題搜索」,「錦囊」,「內(nèi)容搜索」等非商品搜索內(nèi)容,不同搜索目標(biāo)和不同內(nèi)容(物種)之間的聯(lián)合優(yōu)化未來(lái)很值得深挖。
智能交互。「搜索排序做的再好搜索也只是一個(gè)工具」,如何把搜索從工具做成私人導(dǎo)購(gòu)助手,能夠聽(tīng)懂你的語(yǔ)言,了解你的情緒,能夠?qū)υ捄投噍喗换?,解決售前售后困惑,推薦更加個(gè)性化的商品應(yīng)該是搜索未來(lái)的另外一個(gè)主要發(fā)展方向。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。