DataFun
高小青:Impala在神策數(shù)據(jù)實時分析引擎中的落地與優(yōu)化|DataFunTalk
導(dǎo)讀:今天分享的主題是“Impala落地與優(yōu)化:神策數(shù)據(jù)多維分析平臺構(gòu)建實戰(zhàn)”,分為五個部分: 神策產(chǎn)品技術(shù)架構(gòu) 基于Impala的實時分析引擎 查詢性能優(yōu)化 查詢資源預(yù)估 未來計…
周冰倩:廣告主視角下的信息流廣告算法探索|DataFunTalk
廣告主不能像廣告平臺一樣,獲取到比較多的用戶維度的曝光數(shù)據(jù),并且在廣告主側(cè)獲取不到端外新用戶的特征。本次分享會著重講一下哈啰出行作為廣告主,是如何在這些挑戰(zhàn)下進(jìn)行信息流廣告算法建?!?/p>
李翔:美團(tuán)到店綜合知識圖譜的構(gòu)建與應(yīng)用|DataFunTalk
美團(tuán)到店綜合業(yè)務(wù)涵蓋了本地生活中的休閑玩樂、麗人、親子、結(jié)婚、寵物等多個行業(yè)。為了不斷提升到店綜合業(yè)務(wù)場景下的供需匹配效率,美團(tuán)深入挖掘用戶在本地生活中的多樣化需求,構(gòu)建了以用戶需…
張宗耀:bilibili每天100T+的數(shù)據(jù)導(dǎo)入是如何實現(xiàn)的|DataFunTalk
導(dǎo)讀:B站千億級數(shù)據(jù)同步,每天100T+數(shù)據(jù)導(dǎo)入是如何實現(xiàn)的?本文將介紹Apache SeaTunnel在嗶哩嗶哩的實踐。包括以下幾方面內(nèi)容: 工具選擇 日志 提速/限流 監(jiān)控自理…
吳怡雯:騰訊數(shù)據(jù)湖元數(shù)據(jù)治理實踐|?DataFunTalk
導(dǎo)讀:大家好,今天分享的主題是騰訊數(shù)據(jù)湖的元數(shù)據(jù)治理實踐,跟大家一起聊聊騰訊云上DLC數(shù)據(jù)湖計算產(chǎn)品中統(tǒng)一元數(shù)據(jù)的設(shè)計思路和實踐經(jīng)驗,希望能給大家?guī)硪恍﹨⒖肌?本文的內(nèi)容主要包括…
蔣能學(xué):網(wǎng)易云音樂廣告算法實踐|?DataFunTalk
導(dǎo)讀:本次分享的主題為網(wǎng)易云音樂廣告算法實踐,內(nèi)容圍繞以下五個部分: 網(wǎng)易云音樂廣告系統(tǒng)簡介 廣告點擊率預(yù)估模型 廣告轉(zhuǎn)化率預(yù)估模型 用戶向量建模與應(yīng)用 總結(jié)與建議 網(wǎng)易云音樂廣告…
京東算法工程師張菡:深度學(xué)習(xí)下的京東搜索召回技術(shù)|?DataFunTalk
導(dǎo)讀:搜索主要經(jīng)歷四個階段:召回、粗排、精排和重排,最后呈現(xiàn)給用戶最終的結(jié)果。而召回的結(jié)果主要來自兩個部分:倒排檢索和語義召回。傳統(tǒng)的倒排檢索依賴字面匹配,很難去召回一些語義相似但…
谷維:快手如何提升數(shù)據(jù)化管理效率|DataFunTalk
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)對于每個企業(yè),每個人來說都是極其重要的,淘寶通過數(shù)據(jù)可以給每個客戶精準(zhǔn)推薦商品,抖音通過數(shù)據(jù)可以記錄每個用戶的使用習(xí)慣。但同時,數(shù)據(jù)時代的到來,也讓眾多企…
Kevin:QQ音樂命名實體識別技術(shù)|DataFunTalk
導(dǎo)讀:命名實體識別(Named Entity Recognition,簡稱NER)是自然語言處理中的熱點研究方向之一,目的是識別文本中的命名實體,并將其歸納到相應(yīng)的實體類型中。命名…
李茶:虎牙直播推薦系統(tǒng)架構(gòu)詳解|DataFunTalk
大家好,我叫李茶,來自虎牙直播的推薦工程組,主要負(fù)責(zé)虎牙直播的推薦架構(gòu)工作。 直播推薦是一個頭部主播比較集中的場景,比較注重關(guān)系鏈、詞語以及長期的價值,業(yè)務(wù)訴求可能和其他推薦場景有…