Categories
程式開發

用戶畫像從0到100的構建思路


導讀:用戶畫像作為當下描述分析用戶、運營營銷的重要工具,被全部互聯網人熟知,用戶畫像的定義並不復雜,是系統通過用戶自行上傳或埋點上報收集記錄了用戶大量信息,為便於各業務應用,將這些信息進行沉澱、加工和抽象,形成一個以用戶標誌為主key的標籤樹,用於全面刻畫用戶的屬性和行為信息,這就是用戶畫像。

畫像這種結構化的用戶信息加工方式,極大程度上做到了完整、全面且直觀地刻畫用戶。畫像是用戶在產品的檔案,便於人工使用、機器輸入和算法理解。簡而言之:畫像是由標籤樹及末級標籤的標籤值構成的,全面定量刻畫用戶的結構化信息產品。畫像是標籤的總成,用戶標籤是具體刻畫用戶的結構化信息,以下簡稱標籤。

本文將介紹用戶畫像的構建思路,在畫像構建的過程中,我們把工作分為兩步:

  • 第一步:介紹從0到1的構建思路。
  • 第二步:介紹從1到100的構建思路。

1. 畫像從0到1的構建思路

一個比較成熟的畫像系統,會有成千上百的標籤,這些標籤的生產不是一次完成的,而是隨著業務的發展需要,逐步補充完善,最終呈現在大家眼前的就是一棵龐大的標籤樹。

跟自然界的樹木一樣,要想長得茁壯參天,必須有一個穩定的根基和合理的結構,用戶畫像的構建也是一樣的,前期最重要的仍然是搭好畫像骨架,確保後續的發展過程中,依然保持清晰的結構和高延展性。相反的,如果一開始為了搶時間,將大量標籤無序的堆在線上,後期管理和使用的難度會迅速凸顯出來,重構的代價巨大。

上面說到,一個好的標籤樹結構要滿足兩個條件,“高概括性”和“強延展性”,高概括性意味著結構體系能夠很好的包含一個用戶的基本屬性和產品交互的相關行為,同時對於業務重點單獨強調,沒有遺漏;“強延展性”意味著結構全面的同時也有一定的抽象概括能力,保證新增的標籤可以很好的找到對應的分類,整個體係不會過於收斂局限。

按照這個原則,畫像通常從八個維度組織標籤,分別為:基本屬性、平台屬性、行為屬性、產品偏好、興趣偏好、敏感度、消費屬性、用戶生命週期及用戶價值。

下圖所示為用戶整體架構示例:

用戶畫像從0到100的構建思路 1

用戶畫像整體架構示例

① 基本屬性

基本屬性是指一個用戶的基本社會屬性和變更頻率低的平台特徵,例如真實社會年齡、性別、婚姻狀況、暱稱、號碼、賬號、lbs等標籤。這些標籤類型多為直採型,可從用戶基本信息表中直接獲取,不需要統計或者算法挖掘。

示例:社會性別_女

② 平台屬性

平台屬性是用戶在平台上表現出的基本屬性特徵,是利用用戶行為進行算法挖掘,標識用戶真實屬性的標籤。

最典型的平台屬性標籤例如平台年齡標籤,這裡就有一個疑問,為什麼在用戶的基礎屬性中已經有年齡標籤,但在平台屬性中重複又有一個呢,這裡就涉及兩者之間的差別。設想一個真實的場景:一個用戶社會身份為20歲,但他喜歡中年人的穿衣風格,在使用app購物的時候,表現出的真實偏好為30-40歲,對於這樣使用產品時表現出的用戶心智和真實年齡不相符合的用戶,如果只採用上傳的基本屬性,給他推薦年輕人喜歡的物品,是不是很難命中個體用戶的興趣呢?

兩種不同的標籤,本質上是用戶自己上傳信息的隨意性和挖掘信息的權威性差異,是用戶社會屬性和真實屬性差異。

我們仔細分析一下兩者在數據源、計算邏輯、標籤格式、標籤值和應用場景的差異,如下:

數據源與計算邏輯:基礎屬性是利用用戶自行上傳的存儲在用戶基礎信息表裡的數據,平台屬性則利用客戶端或者服務端埋點上報採集的用戶行為數據進行挖掘計算生成。基本屬性是典型的直採型標籤,平台屬性是典型的算法挖掘型標籤。

末級標籤和輸出標籤值:以性別為例,基本屬性代表用戶真實的社會身份,是確定的事實,所以典型標籤形式為“性別_女”,而平台屬性則代表用戶在性別維度的偏好概率,所以典型形式為“性別_女_0.80”其中’女’為末級標籤,0.80則代表用戶在平台的女性身份上表現出的傾向程度。

應用場景:平台屬性通過用戶行為進行挖掘,更能代表用戶的真實傾向,輸出結果比基本屬性準確率高,在定向營銷和算法裡,年齡、性別等通常採用平台屬性。而社會屬性中電話、身份證、賬號、暱稱等使用較多。

③ 行為屬性

行為屬性記錄的是用戶的全部單點行為,用戶的單點行為包括啟動、登錄、瀏覽、點擊、加車、下單等非常多,而且跟不同的產品,不同的模塊交互,不同的時間窗選取,行為就更加複雜了,如何能夠全面的梳理,可以按照“產品*功能模塊*用戶單點行為*時間”四大要素來組織。

這裡的“產品*功能模塊*用戶單點行為*時間”意思是一個完整的行為應該包含“哪個產品”“哪個功能模塊”“哪個行為”“哪些時間要求”幾要素,例如某瀏覽器體育頻道距今最近一次訪問時間。按照這幾要素組織行為,不容易發生遺漏。

示例:產品初次登錄時間,最後一次啟動距今時間,30天內搜索行為頻次,一個月內閃屏訪問次數等。

④ 產品偏好

產品偏好是對用戶使用某些產品、產品核心功能或者其他渠道的偏好程度的刻畫,屬於挖掘型標籤,其中產品的選取可以包括自家產品、競品;功能和渠道包括站內產品功能,也包括push 、短信、開屏、彈窗等幾大運營和產品法寶。

示例:搜索模塊偏好、直接競品_京東偏好、短信偏好。

⑤ 興趣偏好

興趣偏好是用戶畫像內非常重要的維度,以電商產品為例,用戶對商品的喜愛程度是用戶最終的信息之一,興趣偏好就是對用戶和物品之間的關係進行深度刻畫的重要標籤,其中最典型的要屬品牌偏好、類目偏好和標籤偏好。

示例:品牌偏好_優衣庫_0.91類目偏好_美妝_0.80、標籤偏好_紅色_0.70。

⑥ 敏感度

在營銷活動時,我們留意到有些用戶不需要優惠也會下單,而有些用戶一定要通過優惠券刺激才會轉化,優惠券的額度也影響了用戶下單的金額,這種情況下,如何識別對優惠敏感的用戶發放合理的券額的優惠券,保證優惠券不浪費,去報促銷活動的ROI最大,其中一個很重要的標籤就是用戶的敏感度標籤,敏感度代表用戶對平台活動或者優惠的敏感程度,也是典型的挖掘類標籤。

示例:熱點敏感度、折扣敏感度。

⑦ 消費屬性

無論是電商、內容或者其他領域,公司的目標最終都是收益,所以消費屬性往往作為一個單獨的維度重點刻畫。消費屬性包括統計型標籤——消費頻次、消費金額、最近一次消費時間等,也包括挖掘型標籤——消費能力和消費意願,同時包含敏感度標籤——優惠促銷敏感度、活動敏感度、新品敏感度、爆款敏感度等。

⑧ 用戶生命週期及用戶價值

用戶生命週期是用戶運營的重要法典,一個用戶從進入產品到離開,通常會經歷“新手”“成長”“成熟”“衰退”“流失”5個典型階段,每個階段對用戶運營存在策略差異,畫像在其中的作用是明確標記用戶所處生命週期的階段,便於後續業務同學落地。

用戶價值是體現用戶為產品貢獻價值高低的標籤,最經典的是RFM模型獲得交易維度標籤,與此同時,也應該看到用戶的其它價值,例如為產品貢獻活躍度,通過裂變拉來新用戶,這些都可設計相應的標籤。

示例:新手、成長、成熟、衰退、流失、高價值用戶、VIP等級等。

2. 畫像從1到100的構建思路

在前面一節,我們討論了一個用戶畫像的基礎框架應該如何搭建,這一節討論一下,有了基礎框架,到底應該如何著手一步一步完善畫像標籤樹,如何從一個基於業務的需求落地為標籤的設計,如何將標籤應用到具體的業務中。

要解決“如何做”“如何用”兩大問題,要從這個問題的根本入手思考,也就是我們為什麼要做用戶畫像,用戶畫像的作用是什麼,了解了這個問題,便能水到渠成的根據用途合理的設計方案。

用戶畫像的主要目的有三個,具體如下:

第一用於用戶信息的統計,建立對產品對用戶的基本認知;第二用於用戶定向營銷,利用人群圈選投放物料;第三用於算法,沉澱用戶特徵,供模型使用。所以標籤的完善也可以按照這三個維度不斷豐富,以下分別舉例說明標籤建設的思路。

① 用於統計,對產品對用戶的基本認知

每個產品功能策略完善,都需要建立在對產品對用戶的充分認知基礎上,也就是說,用戶是誰,有何特點,基本情況如何,這些是用戶畫像需要回答的重要問題。

思路拆解:既然要了解用戶的基礎信息,就需要將用戶基本屬性進行拆解:年齡、性別、居住城市(幾線)、家庭結構(婚否、孩否)等。為了盈利考慮,還需要了解基本的收入水平、消費能力等。將拆解的維度抽象,構建對應標籤,然後進行分佈統計,便能生成一份基本的用戶認知報告。

標籤結果:年齡、性別等。

② 用於定向營銷和精細化運營

運營同學作為畫像的重要業務使用方,每天都會通過標籤圈選人群,做定向的用戶、活動、內容精細化運營,以及各app每天都在進行的促銷活動。這些運營和活動的場景分佈在產品的各個渠道和各個資源位,對場景和人群的驚喜程度要求都很高。

我們舉例一個日常工作中最常見的需求:通過一次數據分析發現,產品的流失用戶佔比提升,通過討論,大家認為通過一次結合利益點的push推送,召回流失用戶,是有效且快速的手段,同時push作為各個業務都在爭取的有限資源,希望可以提高使用效率,確保push這個資源渠道的整體ROI,以上需求希望畫像可以支持。

思路拆解:從這個需求背景中,我們做一次關鍵詞提取,不難發現,關鍵詞如下是“流失用戶”、“利益點”、“push”“效率”。其中流失用戶是用戶身分識別,利益點是用戶優惠敏感度,push是產品渠道資源,效率意味著要盡可能的確保全選人群精準,不能為了覆蓋率犧牲準確率。

思路拆解完畢,具體落地就變得簡單多了,參考步驟如下:

第一步:需要流失用戶的口徑和標籤,這裡需要用到用戶生命週期的劃分,從中識別並標識出流失用戶。

第二步:分析對流失用戶拉回效果最好的利益點,例如優惠券、折扣、禮品或者是其他內容。這一步需要運營和數據同學根據日常經驗和數據分析獲得,對於畫像的要求是基於分析結論,挖掘不同用戶對於優惠折扣的敏感程度,這一部分在標籤架構敏感度部分有論述,最終目的是確保每一分錢​​都能花在刀刃上。

第三步:確定拉回的明確目標,是拉回規模還是準確率,通過需求分析可以確定,本次拉回在資源有限的情況下,需要提升人群識別的準確率,畫像實現準確率的方法有兩條路徑,一是提升畫像算法的準確率,這部分主要依賴算法本身,無法一蹴而就,所以這裡選擇的方法是增加人群全選的條件,可就是新增標籤,供圈選求交

根據背景分析,我們可以增加流失用戶關於push渠道的打開意願的標籤,提高push資源的使用效率。

經過上述分析,需要生產的標籤如下:

  • 用戶生命週期_流失。
  • 用戶折扣優惠敏感度。
  • push使用標籤:這裡可用統計型標籤,例如push最近一次訪問時間,在使用時設置條件為“最近3天,最近7天”;也可用綜合的算法挖掘型標籤,即push渠道偏好。

通過以上需求分析和思路拆解,畫像的建設過程應該比較明確,這裡再留一個思考的case,可以嘗試如何分析如何落地:平台新上一款商品,初期需要在某模塊展示給目標用戶做推廣,同時盡量不打擾其他非目標用戶,不降低該資源位的整體轉化效率。

思路拆解提示:商品的目標用戶——商品可以按照哪些維度拆分關鍵信息?模塊位置——用戶的模塊功能使用偏好是什麼?準確率的要求——如何提升畫像應用的準確率?

回答好以上問題,這個需求的標籤便能順利獲得。

③ 用於算法,主要應用於搜索推薦、風控廣告等策略方向,標籤可以直接作為用戶特徵使用

標籤除了用於基本的用戶群體描述,定向營銷和精細化運營,還有一個相對來說新穎又廣泛的用途,用於各算法的各個環節,在召回和排序兩大經典策略流程中,都可以用到用戶畫像,這裡我們舉例畫像在推薦系統的召回層應用案例。

需求背景:推薦系統的本質是從海量信息中計算用戶最感興趣的部分,對應推薦系統的“召回-粗排-精排”,是一個“層層精選”的過程。其中召回層是精選的第一道流程,為後續計算打分準備初步的興趣候選集,這裡候選集的生成方法之一就是用戶畫像法。仍然以電商業務為例,講述如何用用戶畫像做興趣召回。

思路拆解:召回的作用是粗篩,幫助推薦系統計算第一道用戶興趣池,這裡用戶對物品的興趣興趣可拆解為對商品品牌、類目和商品標籤的興趣,這部分就已經轉化為上述文章中的已知內容,用戶標籤中是有品牌偏好標籤、類目偏好標籤和標籤偏好標籤的,只需要在所有品牌、類目、標籤下維護一個按照商品質量或者熱度倒敘的列表,這樣只要獲取到用戶標識,邊能從用戶畫像中獲取偏好的品牌、類目和標籤,再從品牌、類目和標籤下的商品列表中召回相應的商品,根據候選集大小的設計,做top k截斷召回。這部分商品完成了初步的召回,為進入下一個流程進行粗排和精排做準備。

以上章節,選自:《數據產品經理:實戰進階》

新書推薦

用戶畫像從0到100的構建思路 2

本書鮮讀專欄價:89元=電子書(提前三個月看到)+紙質書+12個作者維護的付費知識星球。如果轉發鏈接,還可以拿到更大優惠:可以得到成交返利的40%。 (具體操作方法,可識別文末海報二維碼,獲得詳細教程,以及知識星球加入方式。)

以下為作者楊楠楠老師對本書的介紹

1. 為什麼要寫這本書

本書誕生於數據產品經理社群。

四年前,我在知乎上開始寫數據產品經理的專欄,幾個月間,有幾千名讀者關注我,加我微信,於是我就建立了數據產品的微信群。

很多人都在群裡問,有沒有一本可以讓數據產品經理系統學習的書?

世上本沒有這樣的書,問的人多了,我決定自己寫一本。

考慮到個人的經歷,始終只是數據產品的眾多種類中的一部分,於是我在群裡召集大家一起寫。

響應者眾,有20多名數據產品經理,報上來的章節有30章。超過了我的預期。而我挨個聊下來,發現每個人手裡,都有足夠好的項目,在自己的領域,也有足夠的資歷來傳播經驗。

於是跟華章的總編輯楊福川老師商量,我們決定出兩本書,一本講專業知識:《數據產品經理進階》,一本講案例:《數據產品經理實戰》。

在三四年處理眾多問題和諮詢的過程中,我發現數據產品經理隨著成長,主要分成以下幾個階段:

  • 初級/中級階段:自己怎麼樣可以在團隊中發揮更大作用。很多產品經理要么是執行業務的需求,要么執行老闆的需求,要么是在幫算法RD標數據,價值感不足;
  • 中級/高級階段:怎麼讓數據對公司業務產生價值;

我們的每個作者,都已經超越了上述兩個階段。

他們是這個行業的中堅力量,也願意給這個行業留下自己的痕跡。

《數據產品經理實戰》書,主要回答了第二個問題,每個案例在業內都屬於非常好的項目,給公司帶來了較大的收益。

而《數據產品經理進階》(以下簡稱《進階》)這本書,主要篤實數據產品經理的知識結構,幫助讀者度過第一個階段,包括以下內容:

① 為了讓你可以進一步了解數據產品經理,我們提供了:數據產品的行業視野、產品經理自身的能力要求、以及面試和招聘;

② 為了讓你hold住全場,成為團隊的驅動力,我們提供了通用能力模塊,包括數據分析能力、產品經理的項目運轉能力;

③ 只有數據部門能使用數據,沒法做到數據驅動。讓公司的每個部門、每個人,都能方便快捷的使用數據做決策,才算是數據賦能,才能夠極大的提升整個公司的數據水平。

這需要良好的數據建設能力。

所以,我們提供了數據採集、治理、應用、能力輸出的整個鏈條的內容:

  • 數據採集:埋點體系
  • 數據治理:數據中台、指標體系、數據管理;數據治理是數據建設的基礎,所以這一步共提供了三章內容。
  • 保證數據良好的應用:ab測試系統;
  • 數據能力輸出,把數據賦能於各個部門:數據服務。

④ 策略產品可以直接將數據變現,是非常重要的一個數據產品的方向,我們提供了搜索、用戶畫像等常見的策略產品的知識。

不同的公司對數據的要求不同,有些公司會更關注可以直接進行數據變現的能力,有些公司會更關注數據建設的能力。

那對於一個新手,要不要了解這麼多內容?

這裡提供一個做事思路:不要給自己設限。你先留意了這些內容,才會對公司的數據現狀進行思考和認知積累,才能知道公司的數據有哪些機會。

產品管理的主動權,應該是產品經理自己爭取來的,而不是等待別人給你。

在你去爭取之前,我們希望,我們提供的這些章節,是你最好的武器。

2. 讀者對象

  • 數據產品經理:完善自己的數據知識體系和職業成長。
  • 企業領導者:了解數據團隊在數據、產品、運營、市場等多個方面如何產生價值。
  • 想要轉行數據產品經理:了解數據pm具體的工作內容。

3. 致謝

非常感謝12名作者,在工作的百忙之中,犧牲自己的休息時間,辛苦撰寫文章。

感謝機械工業出版社華章公司的編輯楊福川老師:在這半年多的時間中始終支持我的寫作,對書的架構和寫作提出寶貴意見。

感謝項目經理徐湲策:同時協調兩本書的20位作者,是一件非常辛苦和瑣碎的事情。在項目開始的前半個月,我幾乎都在協調,沒有時間寫書,可見這份工作實在是佔用時間和精力。於是我在群裡招項目經理,小徐主動站出來承擔了這個責任,並展現了他在項目管理方面的專業性。

有十餘名志願者參與了本書的試讀,並提出寶貴意見,對本書的質量有很大幫助。他們是:黃宇、夢婷、範昱輝、王資涵;

感謝數據產品群千餘名群員的活躍和分享。

謹以此書獻給數據產品經理路上的前行者!

本文來自 DataFunTalk

原文鏈接

https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247498766&idx=1&sn=938552dcc239419eeb7f9de91d7695ad&chksm=fbd74e62cca0c774f64ebfc91d250b066747d2be2f1464af05536a392a9e0e95db6f6d51f701&scene=27#wechat_redirect