用戶畫(huà)像標(biāo)簽體系建設(shè)指南

01

什么是用戶畫(huà)像

用戶畫(huà)像是指根據(jù)用戶的屬性、用戶偏好、生活習(xí)慣、用戶行為等信息而抽象出來(lái)的標(biāo)簽化用戶模型。

通俗說(shuō)就是給用戶打標(biāo)簽,而標(biāo)簽是通過(guò)對(duì)用戶信息分析而來(lái)的高度精煉的特征標(biāo)識(shí)。通過(guò)打標(biāo)簽可以利用一些高度概括、容易理解的特征來(lái)描述用戶,可以讓人更容易理解用戶,并且可以方便計(jì)算機(jī)處理。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

用戶畫(huà)像是對(duì)現(xiàn)實(shí)世界中用戶的建模,用戶畫(huà)像應(yīng)該包含目標(biāo),方式,組織,標(biāo)準(zhǔn),驗(yàn)證這5個(gè)方面。

目標(biāo):指的是描述人,認(rèn)識(shí)人,了解人,理解人。

方式:又分為非形式化手段,如使用文字、語(yǔ)言、圖像、視頻等方式描述人;形式化手段,即使用數(shù)據(jù)的方式來(lái)刻畫(huà)人物的畫(huà)像。

組織:指的是結(jié)構(gòu)化、非結(jié)構(gòu)化的組織形式。

標(biāo)準(zhǔn):指的是使用常識(shí)、共識(shí)、知識(shí)體系的漸進(jìn)過(guò)程來(lái)刻畫(huà)人物,認(rèn)識(shí)了解用戶。

驗(yàn)證:依據(jù)側(cè)重說(shuō)明了用戶畫(huà)像應(yīng)該來(lái)源事實(shí)、經(jīng)得起推理和檢驗(yàn)。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

在產(chǎn)品早期和發(fā)展期,會(huì)較多地借助用戶畫(huà)像,幫助產(chǎn)品人員理解用戶的需求,想象用戶使用的場(chǎng)景,產(chǎn)品設(shè)計(jì)從為所有人做產(chǎn)品變成為三四個(gè)人做產(chǎn)品,間接的降低復(fù)雜度。

用戶畫(huà)像使用的標(biāo)簽是網(wǎng)絡(luò)標(biāo)簽的一種深化應(yīng)用方式,是某一種用戶特征的符號(hào)表示,是我們觀察、認(rèn)識(shí)和描述用戶的一個(gè)角度,用戶標(biāo)簽是基于用戶的特征數(shù)據(jù)、行為數(shù)據(jù)和消費(fèi)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)計(jì)算得到的,包含了用戶的各個(gè)維度。

而所謂的用戶畫(huà)像就是可以用用戶標(biāo)簽的集合來(lái)表示的,作為一種勾畫(huà)目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計(jì)方向的有效工具。

用戶畫(huà)像,即用戶信息標(biāo)簽化,就是企業(yè)通過(guò)收集與分析消費(fèi)者社會(huì)屬性、生活習(xí)慣、消費(fèi)行為等主要信息的數(shù)據(jù)之后,完美地抽象出一個(gè)用戶的商業(yè)全貌作是企業(yè)應(yīng)用大數(shù)據(jù)技術(shù)的基本方式。

用戶畫(huà)像為企業(yè)提供了足夠的信息基礎(chǔ),能夠幫助企業(yè)快速找到精準(zhǔn)用戶群體以及用戶需求等更為廣泛的反饋信息。

02

用戶標(biāo)簽的分類(lèi)

1、按照標(biāo)簽的變化頻率,可分為靜態(tài)標(biāo)簽和動(dòng)態(tài)標(biāo)簽。

靜態(tài)標(biāo)簽是指用戶與生俱來(lái)的屬性信息,或者是很少發(fā)生變化的信息,比如用戶的姓名、性別、出身日期,又例如用戶學(xué)歷、職業(yè)等,雖然有可能發(fā)生變動(dòng),但這個(gè)變動(dòng)頻率是相對(duì)比較低或者很少發(fā)生變化的。

動(dòng)態(tài)標(biāo)簽是指非常經(jīng)常發(fā)生變動(dòng)的、非常不穩(wěn)定的特征和行為,例如“一段時(shí)間內(nèi)經(jīng)常去的商場(chǎng)、購(gòu)買(mǎi)的商品品類(lèi)”這類(lèi)的標(biāo)簽的變動(dòng)可能是按天,甚至是按小時(shí)計(jì)算的。

2、按照標(biāo)簽的指代和評(píng)估指標(biāo)的不同,可分為定性標(biāo)簽和定量標(biāo)簽。

定性標(biāo)簽指不能直接量化而需通過(guò)其他途徑實(shí)現(xiàn)量化的標(biāo)簽,其標(biāo)簽的值是用文字來(lái)描述的,例如“用戶愛(ài)好的運(yùn)動(dòng)”為“跑步、游泳”,“用戶的在職狀態(tài)”為“未婚”等。定量標(biāo)簽指可以準(zhǔn)確數(shù)量定義、精確衡量并能設(shè)定量化指標(biāo)的標(biāo)簽,其標(biāo)簽的值是常用數(shù)值或數(shù)值范圍來(lái)描述的。

定量標(biāo)簽并不能直觀的說(shuō)明用戶的某種特性,但是我們可以通過(guò)對(duì)大量用戶的數(shù)值進(jìn)行統(tǒng)計(jì)比較后,得到某些信息。例如“用戶的年齡結(jié)構(gòu)”為“20-25歲”、“單次購(gòu)買(mǎi)平均金額”為“300元”,“購(gòu)買(mǎi)的總金額”為“20萬(wàn)元”……,當(dāng)我們獲得以上信息是否就可以將該用戶劃分為高價(jià)值客戶呢?

3、按照標(biāo)簽的來(lái)源渠道和生成方式不同,可以分為基礎(chǔ)標(biāo)簽、業(yè)務(wù)標(biāo)簽、智能標(biāo)簽。

基礎(chǔ)標(biāo)簽主要是指對(duì)用戶基礎(chǔ)特征的描述,比如:姓名、性別、年齡、身高、體重等。

業(yè)務(wù)標(biāo)簽是在基礎(chǔ)標(biāo)簽之上依據(jù)相關(guān)業(yè)務(wù)的業(yè)務(wù)經(jīng)驗(yàn)并結(jié)合統(tǒng)計(jì)方法生成的標(biāo)簽,比如:用戶忠誠(chéng)度、用戶購(gòu)買(mǎi)力等標(biāo)簽就是根據(jù)用戶的登錄次數(shù)、在線時(shí)間、單位時(shí)間活躍次數(shù)、購(gòu)買(mǎi)次數(shù)、單次購(gòu)買(mǎi)金額、總購(gòu)買(mǎi)金額等指標(biāo)計(jì)算出來(lái)的。業(yè)務(wù)標(biāo)簽可以將經(jīng)營(yíng)固化為知識(shí),為更多的人使用。

智能標(biāo)簽是利用人工智能技術(shù)基于機(jī)器學(xué)習(xí)算法,通過(guò)大量的數(shù)據(jù)計(jì)算而實(shí)現(xiàn)的自動(dòng)化、推薦式的進(jìn)行打標(biāo)簽,比如今日頭條的推薦引擎就是通過(guò)智能標(biāo)簽體系給用戶推送其感興趣的內(nèi)容的。

4、按照標(biāo)簽體系分級(jí)分層的方式,可以分為一級(jí)標(biāo)簽、二級(jí)標(biāo)簽、三級(jí)標(biāo)簽等,每一個(gè)層級(jí)的標(biāo)簽相當(dāng)于一個(gè)業(yè)務(wù)維度的切面。在標(biāo)簽應(yīng)用中按照不同的業(yè)務(wù)場(chǎng)景進(jìn)行標(biāo)簽組合,形成相應(yīng)用戶畫(huà)像。

5、按照數(shù)據(jù)提取和處理的維度,可以將標(biāo)簽分為事實(shí)標(biāo)簽,模型標(biāo)簽,預(yù)測(cè)標(biāo)簽。這種用戶標(biāo)簽的分類(lèi)方式更多是面向技術(shù)人員使用,幫助他們?cè)O(shè)計(jì)合理的數(shù)據(jù)處理單元。

事實(shí)標(biāo)簽。既定事實(shí),直接從原始數(shù)據(jù)中提取,描述用戶的自然屬性、產(chǎn)品屬性、消費(fèi)屬性等,事實(shí)標(biāo)簽其本身不需要模型與算法,實(shí)現(xiàn)簡(jiǎn)單,但規(guī)模需要不斷基于業(yè)務(wù)補(bǔ)充與豐富,比如:姓名、購(gòu)買(mǎi)的產(chǎn)品品類(lèi)、所在小區(qū)等。

模型標(biāo)簽。對(duì)用戶屬性及行為等屬性的抽象和聚類(lèi),通過(guò)剖析用戶的基礎(chǔ)數(shù)據(jù)為用戶貼上相應(yīng)的總結(jié)概括性標(biāo)簽及指數(shù),標(biāo)簽代表用戶的興趣、偏好、需求等,指數(shù)代表用戶的興趣程度、需求程度、購(gòu)買(mǎi)概率等。

預(yù)測(cè)標(biāo)簽。參考已有事實(shí)數(shù)據(jù),基于用戶的屬性、行為、位置和特征,通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)以及神經(jīng)網(wǎng)絡(luò)等算法進(jìn)行用戶行為預(yù)測(cè),針對(duì)這些行為預(yù)測(cè)配合營(yíng)銷(xiāo)策略、規(guī)則進(jìn)行打標(biāo)簽,實(shí)現(xiàn)營(yíng)銷(xiāo)適時(shí)、適機(jī)、適景推送給用戶

。例如試用了某產(chǎn)品A后預(yù)測(cè)可能還想買(mǎi)產(chǎn)品B并推送購(gòu)買(mǎi)鏈接給該用戶。

03

用戶畫(huà)像標(biāo)簽體系的建立

1、什么是標(biāo)簽體系

用戶畫(huà)像是對(duì)現(xiàn)實(shí)用戶做的一個(gè)數(shù)學(xué)模型,在整個(gè)數(shù)學(xué)模型中,核心是怎么描述業(yè)務(wù)知識(shí)體系,而這個(gè)業(yè)務(wù)知識(shí)體系就是本體論,本體論很復(fù)雜,我們找到一個(gè)特別樸素的實(shí)現(xiàn),就是標(biāo)簽。

標(biāo)簽是某一種用戶特征的符號(hào)表示。是一種內(nèi)容組織方式,是一種關(guān)聯(lián)性很強(qiáng)的關(guān)鍵字,能方便的幫助我們找到合適的內(nèi)容及內(nèi)容分類(lèi)。(注:簡(jiǎn)單說(shuō),就是你把用戶分到多少個(gè)類(lèi)別里面去,這些類(lèi)是什么,彼此之間有什么關(guān)系,就構(gòu)成了標(biāo)簽體系)

標(biāo)簽解決的是描述(或命名)問(wèn)題,但在實(shí)際應(yīng)用中,還需要解決數(shù)據(jù)之間的關(guān)聯(lián),所以通常將標(biāo)簽作為一個(gè)體系來(lái)設(shè)計(jì),以解決數(shù)據(jù)之間的關(guān)聯(lián)問(wèn)題。

一般來(lái)說(shuō),將能關(guān)聯(lián)到具體用戶數(shù)據(jù)的標(biāo)簽,稱(chēng)為葉子標(biāo)簽。對(duì)葉子標(biāo)簽進(jìn)行分類(lèi)匯總的標(biāo)簽,稱(chēng)為父標(biāo)簽。父標(biāo)簽和葉子標(biāo)簽共同構(gòu)成標(biāo)簽體系,但兩者是相對(duì)概念。例如:下表中,地市、型號(hào)在標(biāo)簽體系中相對(duì)于省份、品牌,是葉子標(biāo)簽。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

用戶畫(huà)像標(biāo)簽體系創(chuàng)建后一般要包含以下幾個(gè)方面的內(nèi)容

(1)標(biāo)簽分類(lèi)

用戶畫(huà)像標(biāo)簽可以分為基礎(chǔ)屬性標(biāo)簽和行為屬性標(biāo)簽。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

由于基于一個(gè)目標(biāo)的畫(huà)像,其標(biāo)簽是在動(dòng)態(tài)擴(kuò)展的,所以其標(biāo)簽體系也沒(méi)有統(tǒng)一的模板,在大分類(lèi)上,與自身的業(yè)務(wù)特征有很大的關(guān)聯(lián),在整體思路上可以從橫縱兩個(gè)維度展開(kāi)思考:橫向是產(chǎn)品內(nèi)數(shù)據(jù)和產(chǎn)品外數(shù)據(jù),縱向是線上數(shù)據(jù)和線下數(shù)據(jù)。而正中間則是永恒不變的“人物基礎(chǔ)屬性”。

如果說(shuō)其他的分類(lèi)因企業(yè)特征而定,那么只有人物特征屬性(至于名字叫什么不重要,關(guān)鍵是內(nèi)涵)是各家企業(yè)不能缺失的板塊。

所謂人物基礎(chǔ)屬性指的是:用戶客觀的屬性而非用戶自我表達(dá)的屬性,也就是描述用戶真實(shí)人口屬性的標(biāo)簽。

所謂非“自我表達(dá)”,舉例來(lái)說(shuō),某產(chǎn)品內(nèi)個(gè)人信息有性別一項(xiàng),用戶填寫(xiě)為“女”,而通過(guò)用戶上傳的身份證號(hào),以及用戶照片,用戶購(gòu)買(mǎi)的產(chǎn)品,甚至用戶打來(lái)的客服電話,都發(fā)現(xiàn)該用戶性別是“男性”。那么在人物基礎(chǔ)屬性中的性別,應(yīng)該標(biāo)識(shí)的是“男性”,但是用戶信息標(biāo)簽部分,自我描述的性別則可能標(biāo)注為女性。

(2)標(biāo)簽級(jí)別(標(biāo)簽的體系結(jié)構(gòu))

分級(jí)有兩個(gè)層面的含義,其一是:指標(biāo)到最低層級(jí)的涵蓋的層級(jí);其二是指:指標(biāo)的運(yùn)算層級(jí)。其一非常好理解,這里重點(diǎn)說(shuō)運(yùn)算層級(jí)。

標(biāo)簽從運(yùn)算層級(jí)角度可以分為三層:事實(shí)標(biāo)簽、模型標(biāo)簽、預(yù)測(cè)標(biāo)簽。

事實(shí)標(biāo)簽:是通過(guò)對(duì)于原始數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析而來(lái)的,比如用戶投訴次數(shù),是基于用戶一段時(shí)間內(nèi)實(shí)際投訴的行為做的統(tǒng)計(jì)。

模型標(biāo)簽:模型標(biāo)簽是以事實(shí)標(biāo)簽為基礎(chǔ),通過(guò)構(gòu)建事實(shí)標(biāo)簽與業(yè)務(wù)問(wèn)題之間的模型,進(jìn)行模型分析得到。比如,結(jié)合用戶實(shí)際投訴次數(shù)、用戶購(gòu)買(mǎi)品類(lèi)、用戶支付的金額等,進(jìn)行用戶投訴傾向類(lèi)型的識(shí)別,方便客服進(jìn)行分類(lèi)處理。

預(yù)測(cè)標(biāo)簽:則是在模型的基礎(chǔ)上做預(yù)測(cè),比如針對(duì)投訴傾向類(lèi)型結(jié)構(gòu)的變化,預(yù)測(cè)平臺(tái)輿情風(fēng)險(xiǎn)指數(shù)。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

(3)標(biāo)簽命名&賦值

我們用一張圖來(lái)說(shuō)明一下命名和賦值的差別,只要在構(gòu)建用戶標(biāo)簽的過(guò)程種,有意識(shí)的區(qū)別標(biāo)簽命名和賦值足矣,不再贅述。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

(4)標(biāo)簽屬性

標(biāo)簽屬性可以理解為針對(duì)標(biāo)簽進(jìn)行的再標(biāo)注,這一環(huán)節(jié)的工作主要目的是幫助內(nèi)部理解標(biāo)簽賦值的來(lái)源,進(jìn)而理解指標(biāo)的含義。如圖所示,可以總結(jié)為5種來(lái)源:

1、固有屬性:是指這些指標(biāo)的賦值體現(xiàn)的是用戶生而有之或者事實(shí)存在的,不以外界條件或者自身認(rèn)知的改變而改變的屬性。比如:性別、年齡、是否生育等。

2、推導(dǎo)屬性:由其他屬性推導(dǎo)而來(lái)的屬性,比如星座,我們可以通過(guò)用戶的生日推導(dǎo),比如用戶的品類(lèi)偏好,則可以通過(guò)日常購(gòu)買(mǎi)來(lái)推導(dǎo)。

3、行為屬性:產(chǎn)品內(nèi)外實(shí)際發(fā)生的行為被記錄后形成的賦值,比如用戶的登陸時(shí)間,頁(yè)面停留時(shí)長(zhǎng)等。

4、態(tài)度屬性:用戶自我表達(dá)的態(tài)度和意愿。比如說(shuō)我們通過(guò)一份問(wèn)卷向用戶詢問(wèn)一些問(wèn)題,并形成標(biāo)簽,如詢問(wèn)用戶:是否愿意結(jié)婚,是否喜歡某個(gè)品牌等。當(dāng)然在大數(shù)據(jù)的需求背景下,利用問(wèn)卷收集用戶標(biāo)簽的方法效率顯得過(guò)低,更多的是利用產(chǎn)品中相關(guān)的模塊做了用戶態(tài)度信息收集。

5、測(cè)試屬性:測(cè)試屬性是指來(lái)自用戶的態(tài)度表達(dá),但并不是用戶直接表達(dá)的內(nèi)容,而是通過(guò)分析用戶的表達(dá),結(jié)構(gòu)化處理后,得出的測(cè)試結(jié)論。比如,用戶填答了一系列的態(tài)度問(wèn)卷,推導(dǎo)出用戶的價(jià)值觀類(lèi)型等。

值得注意的是,一種標(biāo)簽的屬性可以是多重的,比如:個(gè)人星座這個(gè)標(biāo)簽,既是固有屬性,也是推導(dǎo)屬性,它首先不以個(gè)人的意志為轉(zhuǎn)移,同時(shí)可以通過(guò)身份證號(hào)推導(dǎo)而來(lái)。

即便你成功了建立用戶畫(huà)像的標(biāo)簽體系,也不意味著你就開(kāi)啟了用戶畫(huà)像的成功之路,因?yàn)橛泻艽蟮目赡苁沁@些標(biāo)簽根本無(wú)法獲得,或者說(shuō)無(wú)法賦值。

標(biāo)簽無(wú)法賦值的原因有:數(shù)據(jù)無(wú)法采集(沒(méi)有有效的渠道和方法采集到準(zhǔn)確的數(shù)據(jù),比如用戶身份證號(hào))、數(shù)據(jù)庫(kù)不能打通、建模失?。A(yù)測(cè)指標(biāo)無(wú)法獲得賦值)等等。

2、標(biāo)簽體系結(jié)構(gòu)

標(biāo)簽體系可以歸納出如下的層級(jí)結(jié)構(gòu)。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

(1)原始輸入層

主要指用戶的歷史數(shù)據(jù)信息,如會(huì)員信息、消費(fèi)信息、網(wǎng)絡(luò)行為信息。經(jīng)過(guò)數(shù)據(jù)的清洗,從而達(dá)到用戶標(biāo)簽體系的事實(shí)層。

(2)事實(shí)層

事實(shí)層是用戶信息的準(zhǔn)確描述層,其最重要的特點(diǎn)是,可以從用戶身上得到確定與肯定的驗(yàn)證。如用戶的人口屬性、性別、年齡、籍貫、會(huì)員信息等。

(3)模型預(yù)測(cè)層

通過(guò)利用統(tǒng)計(jì)建模,數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)的思想,對(duì)事實(shí)層的數(shù)據(jù)進(jìn)行分析利用,從而得到描述用戶更為深刻的信息。如通過(guò)建模分析,可以對(duì)用戶的性別偏好進(jìn)行預(yù)測(cè),從而能對(duì)沒(méi)有收集到性別數(shù)據(jù)的新用戶進(jìn)行預(yù)測(cè)。還可以通過(guò)建模與數(shù)據(jù)挖掘,使用聚類(lèi)、關(guān)聯(lián)思想,發(fā)現(xiàn)人群的聚集特征。

(4)營(yíng)銷(xiāo)模型預(yù)測(cè)

利用模型預(yù)測(cè)層結(jié)果,對(duì)不同用戶群體,相同需求的客戶,通過(guò)打標(biāo)簽,建立營(yíng)銷(xiāo)模型,從而分析用戶的活躍度、忠誠(chéng)度、流失度、影響力等可以用來(lái)進(jìn)行營(yíng)銷(xiāo)的數(shù)據(jù)。

(5)業(yè)務(wù)層

業(yè)務(wù)層可以是展現(xiàn)層。它是業(yè)務(wù)邏輯的直接體現(xiàn),如圖中所表示的,有車(chē)一族、有房一族等。

3、標(biāo)簽體系結(jié)構(gòu)分類(lèi)

一般來(lái)說(shuō),設(shè)計(jì)一個(gè)標(biāo)簽體系有3種思路,分別是:

  • (1)結(jié)構(gòu)化標(biāo)簽體系;
  • (2)半結(jié)構(gòu)化標(biāo)簽體系;
  • (3)非結(jié)構(gòu)化標(biāo)簽體系。

(1)結(jié)構(gòu)化標(biāo)簽體系

簡(jiǎn)單地說(shuō),就是標(biāo)簽組織成比較規(guī)整的樹(shù)或森林,有明確的層級(jí)劃分和父子關(guān)系。結(jié)構(gòu)化標(biāo)簽體系看起來(lái)整潔,又比較好解釋?zhuān)诿嫦蚱放茝V告井噴時(shí)比較好用。性別、年齡這類(lèi)人口屬性標(biāo)簽,是最典型的結(jié)構(gòu)化體系。下圖就是Yahoo!受眾定向廣告平臺(tái)采用的結(jié)構(gòu)化標(biāo)簽體系。

(2)半結(jié)構(gòu)化標(biāo)簽體系

在用于效果廣告時(shí),標(biāo)簽設(shè)計(jì)的靈活性大大提高了。標(biāo)簽體系是不是規(guī)整,就不那么重要了,只要有效果就行。在這種思路下,用戶標(biāo)簽往往是在行業(yè)上呈現(xiàn)出一定的并列體系,而各行業(yè)內(nèi)的標(biāo)簽設(shè)計(jì)則以“逮住老鼠就是好貓”為最高指導(dǎo)原則,切不可拘泥于形式。下圖是Bluekai聚合多家數(shù)據(jù)形成的半結(jié)構(gòu)化標(biāo)簽體系。

(3)非結(jié)構(gòu)化標(biāo)簽體系

非結(jié)構(gòu)化,就是各個(gè)標(biāo)簽就事論事,各自反應(yīng)各自的用戶興趣,彼此之間并無(wú)層級(jí)關(guān)系,也很難組織成規(guī)整的樹(shù)狀結(jié)構(gòu)。非結(jié)構(gòu)化標(biāo)簽的典型例子,是搜索廣告里用的關(guān)鍵詞。還有Facebook用的用戶興趣詞。

4、用戶畫(huà)像標(biāo)簽層級(jí)的建模方法

用戶畫(huà)像的核心是標(biāo)簽的建立,用戶畫(huà)像標(biāo)簽建立的各個(gè)階段使用的模型和算法如下圖所示。

用戶畫(huà)像標(biāo)簽體系建設(shè)指南

原始數(shù)據(jù)層。對(duì)原始數(shù)據(jù),我們主要使用文本挖掘的算法進(jìn)行分析如常見(jiàn)的TF-IDF、TopicModel主題模型、LDA 等算法,主要是對(duì)原始數(shù)據(jù)的預(yù)處理和清洗,對(duì)用戶數(shù)據(jù)的匹配和標(biāo)識(shí)。

事實(shí)標(biāo)簽層。通過(guò)文本挖掘的方法,我們從數(shù)據(jù)中盡可能多的提取事實(shí)數(shù)據(jù)信息,如人口屬性信息,用戶行為信息,消費(fèi)信息等。其主要使用的算法是分類(lèi)和聚類(lèi)。分類(lèi)主要用于預(yù)測(cè)新用戶,信息不全的用戶的信息,對(duì)用戶進(jìn)行預(yù)測(cè)分類(lèi)。

聚類(lèi)主要用于分析挖掘出具有相同特征的群體信息,進(jìn)行受眾細(xì)分,市場(chǎng)細(xì)分。對(duì)于文本的特征數(shù)據(jù),其主要使用相似度計(jì)算,如余弦?jiàn)A角,歐式距離等。

模型標(biāo)簽層。使用機(jī)器學(xué)習(xí)的方法,結(jié)合推薦算法。模型標(biāo)簽層完成對(duì)用戶的標(biāo)簽建模與用戶標(biāo)識(shí)。其主要可以采用的算法有回歸,決策樹(shù),支持向量機(jī)等。通過(guò)建模分析,我們可以進(jìn)一步挖掘出用戶的群體特征和個(gè)性權(quán)重特征,從而完善用戶的價(jià)值衡量,服務(wù)滿意度衡量等。

預(yù)測(cè)層。也是標(biāo)簽體系中的營(yíng)銷(xiāo)模型預(yù)測(cè)層。這一層級(jí)利用預(yù)測(cè)算法,如機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí),計(jì)量經(jīng)濟(jì)學(xué)中的回歸預(yù)測(cè),數(shù)學(xué)中的線性規(guī)劃等方法。實(shí)習(xí)對(duì)用戶的流失預(yù)測(cè),忠實(shí)度預(yù)測(cè),興趣程度預(yù)測(cè)等等,從而實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo),個(gè)性化和定制化服務(wù)。

不同的標(biāo)簽層級(jí)會(huì)考慮使用對(duì)其適用的建模方法,對(duì)一些具體的問(wèn)題,有專(zhuān)門(mén)的文章對(duì)其進(jìn)行研究。

05

用戶畫(huà)像的應(yīng)用場(chǎng)景

用戶畫(huà)像,即用戶信息標(biāo)簽化,是企業(yè)通過(guò)收集與分析消費(fèi)者基本屬性、社會(huì)屬性、生活習(xí)慣、行為特征等主要信息的數(shù)據(jù)之后,抽象出用戶的商業(yè)全貌。大數(shù)據(jù)的發(fā)展讓各行各業(yè)都日益聚焦于怎樣利用大數(shù)據(jù)了解用戶需求,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo),進(jìn)而深入挖掘潛在的商業(yè)價(jià)值。

不同的企業(yè)做用戶畫(huà)像有不同的戰(zhàn)略目的,廣告公司做用戶畫(huà)像是為精準(zhǔn)廣告服務(wù),電商做用戶畫(huà)像是為用戶購(gòu)買(mǎi)更多商品,內(nèi)容平臺(tái)做用戶畫(huà)像是推薦用戶更感興趣的內(nèi)容提升流量再變現(xiàn)。企業(yè)對(duì)用戶的了解越多,就越容易為用戶提供所需產(chǎn)品和服務(wù),從而提升用戶的粘性,提升企業(yè)盈利能力。

1、了解用戶

不得不承認(rèn)大數(shù)據(jù)正在改變著各行各業(yè),以前了解用戶主要是通過(guò)用戶調(diào)研和訪談的形式,形式單一、數(shù)據(jù)收集不全、真假難辨。尤其是在產(chǎn)品用戶量擴(kuò)大后,調(diào)研的效用降低,以不能滿足企業(yè)發(fā)展的要求。

利用大數(shù)據(jù)技術(shù),基于標(biāo)簽體系構(gòu)建用戶的360°畫(huà)像,從用戶的各個(gè)維度進(jìn)行分析,了解用戶是誰(shuí),他們有什么特征,他們的興趣偏好,而這些信息的研究是企業(yè)制定營(yíng)銷(xiāo)策略、服務(wù)策略,提升用戶滿意度的重要依據(jù)。

2、精準(zhǔn)營(yíng)銷(xiāo)

要做到精準(zhǔn)營(yíng)銷(xiāo),數(shù)據(jù)是最不可缺的存在。以數(shù)據(jù)為基礎(chǔ),建立用戶畫(huà)像,利用標(biāo)簽,讓系統(tǒng)進(jìn)行智能分組,獲得不同類(lèi)型的目標(biāo)用戶群,針對(duì)每一個(gè)群體策劃并推送針對(duì)性的營(yíng)銷(xiāo)。精準(zhǔn)化營(yíng)銷(xiāo)具有極強(qiáng)的針對(duì)性,是企業(yè)和用戶之間點(diǎn)對(duì)點(diǎn)的交互。它不但可以讓營(yíng)銷(xiāo)變得更加高效,也能為企業(yè)節(jié)約成本。

3、產(chǎn)品創(chuàng)新

在用戶需求為導(dǎo)向的產(chǎn)品研發(fā)中,企業(yè)通過(guò)獲取到的大量目標(biāo)用戶數(shù)據(jù),進(jìn)行分析、處理、組合,初步搭建用戶畫(huà)像,做出用戶喜好、功能需求統(tǒng)計(jì),從而設(shè)計(jì)制造更加符合用戶核心需求的新產(chǎn)品,為用戶提供更加良好的體驗(yàn)和服務(wù)。

4、渠道優(yōu)化

當(dāng)前的零售企業(yè)的銷(xiāo)售渠道有多種,比如:自營(yíng)門(mén)店、經(jīng)銷(xiāo)商代理、電商平臺(tái)、電商APP等,每個(gè)渠道的用戶群體的消費(fèi)能力、興趣偏好可能是不一樣的,通過(guò)用戶畫(huà)像可以讓合適的產(chǎn)品投放在合適的渠道投放,從而增加銷(xiāo)售量,這是目前零售行業(yè)慣用的方法。

5、個(gè)性推薦

眾所周知,今日頭條是個(gè)個(gè)性化的新聞推薦引擎,在今日頭條CEO張一鳴看來(lái),算法是《今日頭條》這款興趣推薦搜索引擎應(yīng)用的核心,這也是與傳統(tǒng)媒體最本質(zhì)的區(qū)別,今日頭條之所以能夠非常懂用戶,精準(zhǔn)推薦出用戶所喜好的新聞,完全得益于算法,而正是精準(zhǔn)推薦,使得今日頭條在短短兩年多的時(shí)間內(nèi)擁有了2.2億用戶,每天有超過(guò)2000萬(wàn)用戶在今日頭條上閱讀自己感興趣的文章。

06用戶畫(huà)像的分類(lèi)

從畫(huà)像方法來(lái)說(shuō),可以分為定性畫(huà)像、定性+定量畫(huà)像、定量畫(huà)像

從應(yīng)用角度來(lái)看,可以分為行為畫(huà)像、健康畫(huà)像、企業(yè)信用畫(huà)像、個(gè)人信用畫(huà)像、靜態(tài)產(chǎn)品畫(huà)像、旋轉(zhuǎn)設(shè)備畫(huà)像、社會(huì)畫(huà)像和經(jīng)濟(jì)畫(huà)像等。

07
用戶畫(huà)像需要用到哪些數(shù)據(jù)

一般來(lái)說(shuō),根據(jù)具體的業(yè)務(wù)內(nèi)容,會(huì)有不同的數(shù)據(jù),不同的業(yè)務(wù)目標(biāo),也會(huì)使用不同的數(shù)據(jù)。在互聯(lián)網(wǎng)領(lǐng)域,用戶畫(huà)像數(shù)據(jù)可以包括以下內(nèi)容:

  • (1)人口屬性:包括性別、年齡等人的基本信息
  • (2)興趣特征:瀏覽內(nèi)容、收藏內(nèi)容、閱讀咨詢、購(gòu)買(mǎi)物品偏好等
  • (3)消費(fèi)特征:與消費(fèi)相關(guān)的特征
  • (4)位置特征:用戶所處城市、所處居住區(qū)域、用戶移動(dòng)軌跡等
  • (5)設(shè)備屬性:使用的終端特征等
  • (6)行為數(shù)據(jù):訪問(wèn)時(shí)間、瀏覽路徑等用戶在網(wǎng)站的行為日志數(shù)據(jù)
  • (7)社交數(shù)據(jù):用戶社交相關(guān)數(shù)據(jù)

用戶畫(huà)像數(shù)據(jù)來(lái)源廣泛,這些數(shù)據(jù)是全方位了解用戶的基礎(chǔ),這里以Qunar的畫(huà)像為例,其畫(huà)像數(shù)據(jù)主要維度如下所示,包括用戶RFM信息、航線信息等。

Qunar的畫(huà)像數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建都是基于Qunar基礎(chǔ)數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建,然后按照維度進(jìn)行劃分。

08
用戶畫(huà)像的作用

在互聯(lián)網(wǎng)、電商領(lǐng)域用戶畫(huà)像常用來(lái)作為精準(zhǔn)營(yíng)銷(xiāo)、推薦系統(tǒng)的基礎(chǔ)性工作,其作用總體包括:

(1)精準(zhǔn)營(yíng)銷(xiāo):根據(jù)歷史用戶特征,分析產(chǎn)品的潛在用戶和用戶的潛在需求,針對(duì)特定群體,利用短信、郵件等方式進(jìn)行營(yíng)銷(xiāo)。

(2)用戶統(tǒng)計(jì):根據(jù)用戶的屬性、行為特征對(duì)用戶進(jìn)行分類(lèi)后,統(tǒng)計(jì)不同特征下的用戶數(shù)量、分布;分析不同用戶畫(huà)像群體的分布特征。

(3)數(shù)據(jù)挖掘:以用戶畫(huà)像為基礎(chǔ)構(gòu)建推薦系統(tǒng)、搜索引擎、廣告投放系統(tǒng),提升服務(wù)精準(zhǔn)度。

(4)服務(wù)產(chǎn)品:對(duì)產(chǎn)品進(jìn)行用戶畫(huà)像,對(duì)產(chǎn)品進(jìn)行受眾分析,更透徹地理解用戶使用產(chǎn)品的心理動(dòng)機(jī)和行為習(xí)慣,完善產(chǎn)品運(yùn)營(yíng),提升服務(wù)質(zhì)量。

(5)行業(yè)報(bào)告&用戶研究:通過(guò)用戶畫(huà)像分析可以了解行業(yè)動(dòng)態(tài),比如人群消費(fèi)習(xí)慣、消費(fèi)偏好分析、不同地域品類(lèi)消費(fèi)差異分析

根據(jù)用戶畫(huà)像的作用可以看出,用戶畫(huà)像的使用場(chǎng)景較多,用戶畫(huà)像可以用來(lái)挖掘用戶興趣、偏好、人口統(tǒng)計(jì)學(xué)特征,主要目的是提升營(yíng)銷(xiāo)精準(zhǔn)度、推薦匹配度,終極目的是提升產(chǎn)品服務(wù),起到提升企業(yè)利潤(rùn)。用戶畫(huà)像適合于各個(gè)產(chǎn)品周期:從新用戶的引流到潛在用戶的挖掘、從老用戶的培養(yǎng)到流失用戶的回流等。

總結(jié)來(lái)說(shuō),用戶畫(huà)像必須從實(shí)際業(yè)務(wù)場(chǎng)景出發(fā),解決實(shí)際的業(yè)務(wù)問(wèn)題,之所以進(jìn)行用戶畫(huà)像,要么是獲取新用戶,要么是提升用戶體驗(yàn)、或者挽回流失用戶等具有明確的業(yè)務(wù)目標(biāo)。

另外關(guān)于用戶畫(huà)像數(shù)據(jù)維度的問(wèn)題,并不是說(shuō)數(shù)據(jù)維度越豐富越好,總之,畫(huà)像維度的設(shè)計(jì)同樣需要緊跟業(yè)務(wù)實(shí)際情況進(jìn)行開(kāi)展。

09

用戶畫(huà)像的體系架構(gòu)

按照應(yīng)用系統(tǒng)分層設(shè)計(jì)的原則,基于標(biāo)簽體系的用戶畫(huà)像的體系結(jié)構(gòu)可以分為:數(shù)據(jù)源層、數(shù)據(jù)采集層、數(shù)據(jù)建模層、數(shù)據(jù)應(yīng)用層,行業(yè)應(yīng)用層等。

數(shù)據(jù)源層:用戶標(biāo)簽體系建設(shè)的需要從不同的來(lái)源匯集數(shù)據(jù),例如,企業(yè)的核心系統(tǒng)(不同的行業(yè)其核心系統(tǒng)不同,對(duì)制造業(yè)來(lái)說(shuō)核心系統(tǒng)有ERP、MES、PLM等),營(yíng)銷(xiāo)系統(tǒng)(CRM),互聯(lián)網(wǎng)數(shù)據(jù)(電商平臺(tái)以及微信、微博、論壇等社交平臺(tái)獲取的數(shù)據(jù)),以及從第三方專(zhuān)業(yè)機(jī)構(gòu)獲取的數(shù)據(jù)(各地的數(shù)據(jù)交易中心購(gòu)買(mǎi)的數(shù)據(jù))。

數(shù)據(jù)采集層:與傳統(tǒng)數(shù)據(jù)項(xiàng)目的數(shù)據(jù)采集不同,基于標(biāo)簽體系的用戶畫(huà)像的數(shù)據(jù)來(lái)源廣泛、數(shù)據(jù)量巨大,數(shù)據(jù)類(lèi)型豐富(包括:結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)),有線上的用戶行為數(shù)據(jù),也有應(yīng)用系統(tǒng)日志數(shù)據(jù),有互聯(lián)網(wǎng)爬蟲(chóng)數(shù)據(jù),也有API接口的第三方數(shù)據(jù)包。

用戶畫(huà)像數(shù)據(jù)采集需要通過(guò)網(wǎng)絡(luò)爬蟲(chóng)或網(wǎng)站公開(kāi)API等方式從網(wǎng)站上獲取數(shù)據(jù)信息,并且可以將非結(jié)構(gòu)化數(shù)據(jù)從網(wǎng)頁(yè)中抽取出來(lái),將其存儲(chǔ)為統(tǒng)一的本地?cái)?shù)據(jù)文件,并支持以結(jié)構(gòu)化的方式存儲(chǔ)。同時(shí)支持圖片、音頻、視頻等文件或附件的采集,附件與正文可以自動(dòng)關(guān)聯(lián)。

數(shù)據(jù)建模:基于標(biāo)簽體系的用戶畫(huà)像建模主要是針對(duì)用戶畫(huà)像的建模和產(chǎn)品的建模。產(chǎn)品畫(huà)像建模包括了數(shù)據(jù)清洗、文本建模、類(lèi)別識(shí)別、品牌識(shí)別、屬性識(shí)別、產(chǎn)品畫(huà)像等;用戶畫(huà)像建模包括了數(shù)據(jù)清洗、用戶全渠道ID識(shí)別、信息整合、分析建模和用戶畫(huà)像。通過(guò)統(tǒng)一產(chǎn)品類(lèi)目和屬性體系和統(tǒng)一的用戶畫(huà)像標(biāo)簽體系的建設(shè),為用戶標(biāo)簽的應(yīng)用提供支撐。

數(shù)據(jù)應(yīng)用:即基于標(biāo)簽體系的應(yīng)用,包括分析類(lèi)應(yīng)用(如用戶分析、產(chǎn)品分析)、服務(wù)類(lèi)應(yīng)用(如服務(wù)及產(chǎn)品創(chuàng)新)、營(yíng)銷(xiāo)類(lèi)應(yīng)用(精準(zhǔn)營(yíng)銷(xiāo))、數(shù)據(jù)接口API等。

行業(yè)應(yīng)用:基于標(biāo)簽體系的用戶畫(huà)像在各行業(yè)的所應(yīng)用和探索,將為行業(yè)的發(fā)展和創(chuàng)新帶來(lái)更多可能。

10
用戶畫(huà)像的建設(shè)步驟

1、數(shù)據(jù)采集

用戶畫(huà)像是根據(jù)用戶的人口信息、社交關(guān)系、偏好習(xí)慣和消費(fèi)行為等信息而抽象出來(lái)的標(biāo)簽化畫(huà)像,用戶畫(huà)像數(shù)據(jù)來(lái)源多樣,采集方式也不同:線下采集、線上采集、第三方接口等。

2、數(shù)據(jù)清洗

要實(shí)現(xiàn)精準(zhǔn)的用戶畫(huà)像就需要對(duì)這些噪聲數(shù)據(jù)、臟數(shù)據(jù)進(jìn)行處理,這個(gè)過(guò)程我們叫做數(shù)據(jù)清洗。

3、數(shù)據(jù)標(biāo)準(zhǔn)化

數(shù)據(jù)標(biāo)準(zhǔn)化的方法有很多種,常用的有“最小—最大標(biāo)準(zhǔn)化”、“Z-score標(biāo)準(zhǔn)化”和“按小數(shù)定標(biāo)標(biāo)準(zhǔn)化”等。經(jīng)過(guò)上述標(biāo)準(zhǔn)化處理,原始數(shù)據(jù)均轉(zhuǎn)換為無(wú)量綱化指標(biāo)測(cè)評(píng)值,即各指標(biāo)值都處于同一個(gè)數(shù)量級(jí)別上,可以進(jìn)行綜合測(cè)評(píng)分析。

4、數(shù)據(jù)建模

數(shù)據(jù)建模就是根據(jù)用戶行為,構(gòu)建模型產(chǎn)出標(biāo)簽、權(quán)重。一個(gè)事件模型包括:時(shí)間、地點(diǎn)、人物三個(gè)要素。每一次用戶行為本質(zhì)上是一次隨機(jī)事件,可以詳細(xì)描述為:什么用戶,在什么時(shí)間,什么地點(diǎn),做了什么事。

用戶動(dòng)態(tài)建模公式:用戶標(biāo)識(shí) +時(shí)間 + 行為類(lèi)型 + 接觸點(diǎn)(網(wǎng)址+內(nèi)容),表示某用戶在什么時(shí)間、地點(diǎn)、做 了什么事,所以會(huì)打上某標(biāo)簽。

用戶標(biāo)簽的權(quán)重可能隨時(shí)間的增加而衰減,因此定義時(shí)間為衰減因子r,行為類(lèi)型,同時(shí)該標(biāo)簽對(duì)該用戶的重要程度也決定了用戶標(biāo)簽的權(quán)重,進(jìn)一步轉(zhuǎn)換為公式:用戶標(biāo)簽權(quán)重 = 行為類(lèi)型權(quán)重 × 時(shí)間衰減 × 用戶行為次數(shù) × TF-IDF計(jì)算標(biāo)簽權(quán)重

行為類(lèi)型權(quán)重:用戶瀏覽、搜索、收藏、下單、購(gòu)買(mǎi)等不同行為對(duì)用戶而言有著不同的重要性(偏序關(guān)系),該權(quán)重值一般由運(yùn)營(yíng)人員或業(yè)務(wù)來(lái)決定;

時(shí)間衰減:用戶某些行為受時(shí)間影響不斷減弱,行為時(shí)間距現(xiàn)在越遠(yuǎn),該行為對(duì)用戶當(dāng)前來(lái)說(shuō)的意義越小,采用牛頓冷卻定律;

行為次數(shù):用戶標(biāo)簽權(quán)重按天統(tǒng)計(jì),用戶某天與該標(biāo)簽產(chǎn)生的行為次數(shù)越多,該標(biāo)簽對(duì)用戶的影響越大。

公式:t=初始溫度×exp(-冷卻系數(shù)×間隔的時(shí)間),實(shí)際應(yīng)用中,初始溫度為1就行,間隔的時(shí)間為今天與產(chǎn)生行為那天的天數(shù),或者小時(shí)數(shù)都行,根據(jù)業(yè)務(wù)進(jìn)行調(diào)整,冷卻系數(shù)的業(yè)務(wù)來(lái)決定,或者通過(guò)數(shù)據(jù)分析而來(lái)。

TF-IDF計(jì)算標(biāo)簽權(quán)重:tf為某標(biāo)簽在該用戶出現(xiàn)頻率,idf為某標(biāo)簽在全部標(biāo)簽中的稀缺程度。

5、標(biāo)簽挖掘

標(biāo)簽挖掘,即對(duì)用戶標(biāo)簽體系中的用戶數(shù)據(jù)進(jìn)行挖掘,形成用戶標(biāo)簽,這個(gè)過(guò)程也叫標(biāo)簽生產(chǎn)。

標(biāo)簽的生產(chǎn)方式主要有以下兩種:

①基于規(guī)則定義的標(biāo)簽生產(chǎn)方式,即根據(jù)固定的規(guī)則,通過(guò)數(shù)據(jù)查詢的結(jié)果生產(chǎn)標(biāo)簽,重點(diǎn)在于如何制定規(guī)則。

②基于主題模型的標(biāo)簽生產(chǎn)方式,主題模型最開(kāi)始運(yùn)用于內(nèi)容領(lǐng)域,目的是找到用戶的偏好,在用戶標(biāo)簽中我們可以參照分類(lèi)算法將用戶進(jìn)行分類(lèi)、聚類(lèi),使用關(guān)鍵詞的算法挖掘用戶的偏好,從而生產(chǎn)標(biāo)簽。

6、數(shù)據(jù)可視化

數(shù)據(jù)可視化是基于標(biāo)簽體系的用戶畫(huà)像的重要應(yīng)用, 通過(guò)詳實(shí)、準(zhǔn)確對(duì)用戶的各類(lèi)標(biāo)簽數(shù)據(jù)進(jìn)行匯集和分析,并以圖片、表格等可視化手段幫助企業(yè)全面了解用戶的基礎(chǔ)信息,用戶關(guān)系情況,用戶經(jīng)濟(jì)情況、用戶偏好情況、健康情況、飲食情況等信息。

同時(shí),利用數(shù)據(jù)標(biāo)簽體系的用戶畫(huà)像可視化技術(shù),通過(guò)對(duì)用戶關(guān)系數(shù)據(jù)、用戶內(nèi)容數(shù)據(jù)、用戶行為等數(shù)據(jù)進(jìn)行可視化展示,能夠幫助企業(yè)管理人員、業(yè)務(wù)人員全面了解用戶,了解用戶是誰(shuí),他們有什么特征,他們的興趣偏好等,從而為智能推薦、精準(zhǔn)營(yíng)銷(xiāo)、產(chǎn)品和服務(wù)創(chuàng)新、渠道優(yōu)化等業(yè)務(wù)提供支撐。

本文經(jīng)授權(quán)發(fā)布,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://allfloridahomeinspectors.com/cgo/user/69915.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2022-05-30 17:07
下一篇 2022-05-30 17:35

增長(zhǎng)黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評(píng)論