Categories
程式開發

滴滴數據指標體系建設實踐


導讀: 指標體係是什麼?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規範化、工具化管理指標體系?本文會對建設的方法論結合滴滴數據指標體系建設實踐進行解答分析。

01 什麼是指標體系

1. 指標體系定義

‍指標體係是將零散單點的具有相互聯繫的指標,系統化的組織起來,通過單點看全局,通過全局解決單點的問題。它主要由指標和體係兩部分組成。

指標是指將業務單元細分後量化的度量值,它使得業務目標可描述、可度量、可拆解,它是業務和數據的結合,是統計的基礎,也是量化效果的重要依據。

指標主要分為結果型和過程型:

  • 結果型指標

    用於衡量用戶發生某個動作後所產生的結果,通常是延後知道的,很難進行干預。結果型指標更多的是監控數據異常,或者是監控某個場景下用戶需求是否被滿足

  • 過程型指標

    用戶在做某個動作時候所產生的指標,可以通過某些運營策略來影響這個過程指標,從而影響最終的結果,過程型指標更加關注用戶的需求為什麼被滿足或沒被滿足

體係是由不同的維度組成,而維度是指用戶觀察、思考與表述某事物的“思維角度”,維度是指標體系的核心,沒有維度,單純說指標是沒有任何意義的。

維度主要分為定性維度和定量維度,定性維度,主要是偏文字描述類如城市、性別、職業等;定量維度,主要是數值類描述如收入、年齡等,對定量維度需要做數值分組處理。

2. 指標體系生命週期

生命週期主要包含定義、生產、消費、下線四個階段。針對整個生命週期要持續做指標運維、質量保障,同時為了提高指標數據復用度,降低用戶使用成本需要做對應的數據運營工作。

滴滴數據指標體系建設實踐 1

3. 綜合使用場景

指標體系主要是結合用戶的業務場景來進行使用,多個不同的指標和維度可以組合起來進行業務的綜合分析,用戶可通過指標的變化看到整體業務的變化,並能夠快速發現問題、定位問題。常用的場景一種是決策分析的場景,通過數據看清業務現狀進行戰略決策支持,另一種是運營分析場景,無論是做用戶運營、產品運營還是活動運營都需要各類指標數據的支撐去看清問題、分析問題和指導解決問題。

02 為什麼搭建指標體系

衡量業務發展質量

指標體係可以反映業務客觀事實,看清業務發展現狀,通過指標對業務質量進行衡量,把控業務發展情況,針對發現的業務問題聚焦解決,促進業務有序增長

建立指標因果關係

主要明確結果型指標和過程型指標關係,通過結果指標回溯過程指標,找到解決問題的核心原因

指導用戶分析工作

目的建立產品評估體系、活動效果評估體系、智能運營分析體系

指導基礎數據建設

明確基礎數據建設方向,集中資源,避免過程和結果分析指標數據的遺漏或缺失

指導內容產品建設

結合用戶的業務場景來進行使用,多個不同的指標和維度可以組合起來進行業務的綜合分析,用戶可通過指標的變化看到整體業務的變化,並能夠快速發現問題、定位問題

統一指標消費口徑

企業內統一關鍵指標業務口徑及計算口徑,統一企業業務目標,實現自上而下目標驅動

03 如何搭建指標體系

指標體系建設的常用方法是通過場景化進行指標體系的搭建,以用戶的視角場景化思考,自上而下業務驅動指標體系建設,所以要在特定場景下做好指標體系建設,需要先選好指標,然後用科學的方法搭建指標體系。

1. 科學方法選指標

選指標常用方法是指標分級方法和OSM模型。

指標分級主要是指標內容縱向的思考,根據企業戰略目標、組織及業務過程進行自上而下的指標分級,對指標進行層層剖析,主要分為三級T1、T2、T3。

T1指標:公司戰略層面指標

用於衡量公司整體目標達成情況的指標,主要是決策類指標,T1指標使用通常服務於公司戰略決策層

T2指標:業務策略層面指標

為達成T1指標的目標,公司會對目標拆解到業務線或事業群,並有針對性做出一系列運營策略,T2指標通常反映的是策略結果屬於支持性指標同時也是業務線或事業群的核心指標。 T2指標是T1指標的縱向的路徑拆解,便於T1指標的問題定位,T2指標使用通常服務業務線或事業群

T3指標:業務執行層面指標

T3指標是對T2指標的拆解,用於定位T2指標的問題。 T3指標通常也是業務過程中最多的指標。根據各職能部門目標的不同,其關注的指標也各有差異。 T3指標的使用通常可以指導一線運營或分析人員開展工作,內容偏過程性指標,可以快速引導一線人員做出相應的動作。

例如:成交率的指標分級

滴滴數據指標體系建設實踐 2

OSM模型(Obejective,Strategy,Measurement)是指標體系建設過程中輔助確定核心的重要方法,包含業務目標、業務策略、業務度量,是指標內容橫向的思考。

  • 用戶使用產品的目標是什麼?產品滿足了用戶的什麼需求?主要從用戶視角和業務視角確定目標,原則是切實可行、易理解、可干預、正向有益

  • 小號

    為了達成上述目標我採取的策略是什麼?

  • 中號

    這些策略隨之帶來的數據指標變化有哪些?

以滴滴網約車為例,按照OSM模型,它的指標是什麼樣的?

  • O:用戶來使用滴滴這個產品,需求和目標是什麼?
    • 用戶需求及目標是便捷、快速打到車,安全到達目的地

那如何讓用戶感受到自己的需求被滿足了呢?

  • S:滴滴做的策略是:
    • 便捷方面,提供了獨立APP版本、小程序版本,還可以多渠道打到車,例如在高德、微信、支付寶都有打車入口;起始、目的地地圖智能精准定位;最優路線選擇等
    • 快速方面,針對不同人群不同訴求提供了多品類產品選擇,例如快車、優享、拼車、出租車等業務,根據早晚高峰提高熱點區域運力,減少用戶排隊時間
    • 安全方面,司機准入機制,司機合規機制,司機畫像
  • M:我們需要針對這些策略去做指標,在這裡面我們的指標分別是結果指標和過程指標:
    • 結果指標:渠道轉化完成率、乘客取消率、供需比、司機服務分
    • 過程指標:渠道發單數、渠道完單數、排隊乘客數、乘客排隊時長、司機好評率、司機接單量、司機取消數等

指標選取之後,下面就是最重要的分析維度選擇了,前面指標體系定義裡講過維度是指標體系的核心,沒有維度,單純說指標是沒有任何意義的。所以維度選擇層面主要通過數據分析視角結合實際分析業務場景來確定。例如城市維度、商圈維度、渠道維度、時間維度、用戶標籤維度等。

2. 用分析模型搭建指標體系

在《精益數據分析》一書中給出了兩套比較常用的指標體系建設方法論,其中一個就是比較有名的海盜指標法,也就是我們經常聽到的AARRR海盜模型。海盜模型是用戶分析的經典模型,它反映了增長是系統性地貫穿於用戶生命週期各個階段的:用戶拉新(Acquisition)、用戶激活(Activation)、用戶留存(Retention)、商業變現(Revenue) 、用戶推薦(Referral)。

AARRR模型

  • A拉新

    通過各種推廣渠道,以各種方式獲取目標用戶,並對各種營銷渠道的效果評估,不斷優化投入策略,降低獲客成本。涉及關鍵指標例如新增註冊用戶數、激活率、註冊轉化率、新客留存率、下載量、安裝量等

  • A活躍

    活躍用戶指真正開始使用了產品提供的價值,我們需要掌握用戶的行為數據,監控產品健康程度。這個模塊主要反映用戶進入產品的行為表現,是產品體驗的核心所在。涉及關鍵指標例如DAU/MAU 、日均使用時長、啟動APP時長、啟動APP次數等

  • R留存

    衡量用戶粘性和質量的指標。涉及關鍵指標例如留存率、流失率等

  • R變現

    主要用來衡量產品商業價值。涉及關鍵指標例如生命週期價值(LTV)、客單價、GMV等

  • R推薦

    衡量用戶自傳播程度和口碑情況。涉及關鍵指標例如邀請率、裂變係數等

可以根據實際業務場景,結合使用OSM和AARRR模型,來系統性的選擇不同階段所需要的核心數據指標。

滴滴數據指標體系建設實踐 3

3. 場景化搭建指標體系

目前階段互聯網業務比較流行的一種通用抽象場景“人、貨、場”,實際就是我們日常所說的用戶、產品、場景,在通俗點講就是誰在什麼場景下使用了什麼產品,不同的商業模式會有不同的組合模式。

以滴滴實際場景為例:哪些場景(此處場景定義為終端,如Native,微信,支付寶)的什麼人(乘客)在平台上使用了哪些貨(平台業務線,如快車/專車等),進而為評估用戶增長的價值和效果。

“人”的視角

從”人”的視角,我們比較關心的是什麼乘客在什麼時間打的車,排了多長時間,等了多長時間上車,週期內第幾次打車,打車花了多少錢,是否有投訴和取消行為,具體到數據指標主要看發單用戶數、完單用戶數、客單價、週期內完單訂單數、取消訂單數、評價訂單數等。

滴滴數據指標體系建設實踐 4

“貨”的視角

從”貨”的視角,我們比較關心的就是成交了多少,交易額多少,花了多少,到具體數據指標主要會看GMV、成交率、取消率指標,在進一步會細分到城市、區域,一級品類、二級品類。數據的效果通過目標對比,橫向對比、歷史比較等方式進行分析確定。

滴滴數據指標體系建設實踐 5

“場”的視角

從”場”的視角,我們比較關心的就是哪個渠道用戶點擊量大曝光率大,帶來了多少新用戶,完成多少交易訂單,客單價是多少;或者是哪個活動拉新或促活效果怎麼樣轉化率多少,結合場景數據實際情況制定對應策略。

滴滴數據指標體系建設實踐 6

以上分別從”人”、“貨”、”場”三個角度進行了數據指標和分析維度的提煉,下面我們把三類指標結合指標分級方法進行分解關聯。

滴滴數據指標體系建設實踐 7

04 怎麼管理指標體系

1. 痛點分析

主要從業務、技術、產品三個視角來看:

  • 業務視角

    業務分析場景指標、維度不明確;

    頻繁的需求變更和反复迭代,數據報表臃腫,數據參差不齊;

    用戶分析具體業務問題找數據、核對確認數據成本較高。

  • 技術視角

    指標定義,指標命名混亂,指標不唯一,指標維護口徑不一致;

    指標生產,重複建設;數據彙算成本較高;

    指標消費,數據出口不統一,重複輸出,輸出口徑不一致;

  • 產品視角

    缺乏系統產品化支持從生產到消費數據流沒有系統產品層面打通;

2. 管理目標

  • 技術目標

    統一指標和維度管理,指標命名、計算口徑、統計來源唯一, 維度定義規範、維度值一致

  • 業務目標

    統一數據出口、場景化覆蓋

  • 產品目標

    指標體繫管理工具產品化落地;指標體系內容產品化落地支持決策、分析、運營例如決策北極星、智能運營分析產品等

3. 模型架構

滴滴數據指標體系建設實踐 8

業務線

業務板塊定義原則:業務邏輯層面進行抽象、物理組織架構層面進行細分,可根據實際業務情況進行層級分拆細化,層級分級建議進行最多進行三級分拆,一級細分可公司層面統一規範確定,二級及後續拆分可根據業務線實際業務進行拆分。例如滴滴出行領域業務邏輯層面兩輪車和四輪車都屬於出行領域可抽像出行業務板塊(level一級),根據物理組織架構層面在進行細分普惠、網約車、出租車、順風車(level二級),後續根據實際業務需求可在細分,網約車可細分獨乘、合乘,普惠可細分單車、企業級。

規範定義

  1. 數據域

    指面向業務分析,將業務過程或者維度進行抽象的集合。其中,業務過程可以概括為一個個不拆分的行為事件,在業務過程之下,可以定義指標;維度,是度量的環境,如乘客呼單事件,呼單類型是維度。為了保障整個體系的生命力,數據域是需要抽象提煉,並且長期維護更新的,變動需執行變更流程。

  2. 業務過程

    指公司的業務活動事件,如,呼單、支付都是業務過程。其中,業務過程不可拆分。

  3. 時間週期

    用來明確統計的時間範圍或者時間點,如最近30天、自然週、截止當日等。

  4. 修飾類型

    是對修飾詞的一種抽象劃分。修飾類型從屬於某個業務域,如日誌域的訪問終端類型涵蓋APP端、PC端等修飾詞。

  5. 修飾詞

    指的是統計維度以外指標的業務場景限定抽象,修飾詞屬於一種修飾類型,如在日誌域的訪問終端類型下,有修飾詞APP、PC端等。

  6. 度量/原子指標

    原子指標和度量含義相同,基於某一業務事件行為下的度量,是業務定義中不可再拆分的指標,具有明確業務含義的名稱,如支付金額。

  7. 維度

    維度是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,也可以稱為實體對象。維度屬於一個數據域,如地理維度(其中包括國家、地區、省市等)、時間維度(其中包括年、季、月、週、日等級別內容)。

  8. 維度屬性

    維度屬性隸屬於一個維度,如地理維度裡面的國家名稱、國家ID、省份名稱等都屬於維度屬性。

  9. 指標分類

    主要分為原子指標、派生指標、衍生指標

    原子指標

    基於某一業務事件行為下的度量,是業務定義中不可再拆分的指標,具有明確業務含義的名稱,如呼單量、交易金額

    派生指標

    是1個原子指標+多個修飾詞(可選)+時間週期,是原子指標業務統計範圍的圈定。派生指標又分以下二種類型:

    a. 事務型指標:

    是指對業務過程進行衡量的指標。例如,呼單量、訂單支付金額,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標。

    b. 存量型指標:

    是指對實體對象(如司機、乘客)某些狀態的統計,例如註冊司機總數、註冊乘客總數,這類指標需要維護原子指標以及修飾詞,在此基礎上創建派生指標,對應的時間週期一般為“歷史截止當前某個時間”。

    衍生指標

    是在事務性指標和存量型指標的基礎上複合成的。主要有比率型、比例型、統計型均值

模型設計

主要採用維度建模方法進行構建,基礎業務明細事實表主要存儲維度屬性集合和度量/原子指標;分析業務匯總事實表按照指標類別(去重指標、非去重指標)分類存儲,非去重指標匯總事實表存儲統計維度集合、原子指標或派生指標,去重指標匯總事實表只存儲分析實體統計標籤集合。

指標體系在數倉物理實現層面主要是結合數倉模型分層架構進行指導建設,滴滴的指標數據主要存儲在DWM層,作為指標的核心管理層。

滴滴數據指標體系建設實踐 9

4. 指標體系元數據管理

維度管理

包括基礎信息和技術信息,由不同角色進行維護管理。

  • 基礎信息對應維度的業務信息,由業務管理人員、數據產品或BI分析師維護,主要包括維度名稱、業務定義、業務分類。
  • 技術信息對應維度的數據信息,由數據研發維護,主要包括是否有維表(是枚舉維度還是有獨立的物理維表)、是否是日期維、對應code英文名稱和中文名稱、對應name英文名稱和中文名稱。如果維度有維度物理表,則需要和對應的維度物理表綁定,設置code和name對應的字段。如果維度是枚舉維,則需要填寫對應的code和name。維度的統一管理,有利於以後數據表的標準化,也便於用戶的查詢使用。

指標管理

包括基礎信息、技術信息和衍生信息,由不同角色進行維護管理。

  • 基礎信息對應指標的業務信息,由業務管理人員、數據產品或BI分析師維護,主要包括歸屬信息(業務板塊、數據域、業務過程),基本信息(指標名稱、指標英文名稱、指標定義、統計算法說明、指標類型(去重、非去重)),業務場景信息(分析維度,場景描述);
  • 技術信息對應指標的物理模型信息,由數據研發進行維護,主要包括對應物理表及字段信息;
  • 衍生信息對應關聯派生或衍生指標信息、關聯數據應用和業務場景信息,便於用戶查詢指標被哪些其它指標和數據應用使用,提供指標血緣分析追查數據來源的能力。

原子指標定義歸屬信息+ 基本信息+ 業務場景信息

派生指標定義時間週期+ 修飾詞集合+ 原子指標

修飾類型主要包含類型說明、統計算法說明、數據源(可選)

5. 指標體系建設流程

建模流程

建模流程主要是從業務視角指導工程師對需求場景涉及的指標進行主題抽象,歸類,統一業務術語,減少溝通成本,同時避免後續的指標重複建設。

滴滴數據指標體系建設實踐 10

分析數據體係是模型架構中匯總事實表的物理集合,業務邏輯層面根據業務分析對像或場景進行指標體系抽象沉澱。滴滴出行主要是根據分析對象進行主題抽象的,例如司機主題、安全主題、體驗主題、城市主題等。指標分類主要是根據實際業務過程進行抽象分類,例如司機交易類指標、司機註冊類指標、司機增長類指標等。

基礎數據體係是模型架構中明細事實表和基礎維度表的物理集合,業務邏輯層面根據實際業務場景進行抽象例如司機合規、乘客註冊等,還原業務核心業務過程。

開發流程

開發流程是從技術視角指導工程師進行指標體系生產、運維及質量管控,也是數據產品或數據分析師和數倉研發溝通協調的橋樑。

滴滴數據指標體系建設實踐 11

6. 指標體系圖譜建設

指標體系圖譜概述

指標體系圖譜也可稱為數據分析圖譜主要是依據實際業務場景抽象業務分析實體,整合梳理實體涉及的業務分類、分析指標和維度的集合。

建設方法:

主要是通過業務思維、用戶視角去構建,把業務和數據緊密關聯起來,把指標結構化分類組織

建設目的:

  • 對於用戶:

    便於用戶能夠快速定位所需指標和維度,同時通過業務場景化沉澱指標體系,能夠快速觸達用戶數據訴求

  • 對於研發:

    利於後續指標生產模型設計、數據內容邊界化、數據體系建設迭代量化和數據資產的落地

指標體系圖譜模型

滴滴數據指標體系建設實踐 12

指標體系圖譜實例

滴滴數據指標體系建設實踐 13

05 指標體系產品化

滴滴數據指標體系建設實踐 14

指標體系涉及的產品集主要是依據其生命週期進行相應建設,通過產品工具打通數據流,實現指標體系統一化、自動化、規範化、流程化管理。因為指標體系建設本質目標是服務業務,實現數據驅動業務價值,所以建設的核心原則是“輕標準、重場景,從管控式到服務式”。通過工具、產品、技術和組織的融合提高用戶使用數據效率,加速業務創新迭代。

其中和指標體系方法論強相關產品就是指標字典工具的落地,其產品的定位及價值:

  • 支撐指標管理規範從方法到落地的工具,自動生成規範指標,解決指標名稱混亂、指標不唯一的問題,消除數據的二義性
  • 統一對外提供標準的指標口徑和元數據信息

滴滴數據指標體系建設實踐 15

工具設計流程(方法論->定義->生產->消費)

滴滴數據指標體系建設實踐 16

指標定義

滴滴數據指標體系建設實踐 17

指標生產

06 結束語

文章整體介紹了滴滴指標體系建設方法論和工具產品的建設情況,目前指標字典和開發工具已實現流程打通,與數據消費產品的打通後續會通過DataAPI方式提供數據服務,規劃建設中。指標體系建設方法論和工具已經在滴滴集團內進行推廣使用,滴滴網約車、普惠、車服等部門已經開始接入使用,截止目前共有5000+指標進入指標體系,覆蓋公司核心業務板塊、88個數據域、385個業務過程,52個業務場景,方法論和工具也會持續迭代實踐。

作者介紹

曹雷,滴滴高級專家工程師。

專注數據倉庫體系化建設,產品化數倉理念推廣及實踐者。

本文來自DataFunTalk

原文鏈接

滴滴數據指標體系建設實踐