Categories
程式開發

行業知識圖譜在貝殼的應用實踐


導讀:現如今傳統行業紛紛擁抱互聯網,將業務逐漸線上化。但由於傳統行業的數字化程度不高,以及信息流通速度比較慢,導致難以快速了解到市場發生的變化以及自身所處的位置。而行業知識圖譜技術通過合理的引入內部和外部數據,並進行充分的融合和挖掘,可以清晰的看到行業整體的發展趨勢,更好的賦能傳統行業的進一步發展。

本文將從以下幾個方面進行闡述:

行業知識圖譜在貝殼的應用實踐 1

為什麼要做行業知識圖譜

行業知識圖譜在貝殼的應用實踐 2

首先回答下上面的三個問題:

1. 我是誰

行業知識圖譜在貝殼的應用實踐 3

通過對公司內部數據,如業務流水交易數據,行為數據等進行分析,可以準確的了解到自身的發展狀況。比如對貝殼找房的相關內部數據分析,可以知道目前的門店數有13000多家,以及具體的體量規模,掛牌交易量和覆蓋人群等情況。但僅內部數據難以準確的描述公司在整個市場中的位置。

2. 我在哪

行業知識圖譜在貝殼的應用實踐 4

通過引入外部數據,可以定量化的描述行業整體的發展狀況,從而了解自身所處的位置。比如通過業界對貝殼的評價,以及一些市場行業數據的分析,可以得到貝殼的交易規模和房源掛牌量都是業界第一。從橫向維度上進行比較,即與房產中介和房源平台對標的情況,可以知道貝殼找房現為業界領頭羊;從縱向時間維度上來看,可以對比十年前的自己和競爭對手與現在的自己的變化情況;從數據上來看,比如門店掛牌量和門店帶看量可以反映經紀人作業的情況,或者通過區域門店與GMV的佔比來進一步明確自身的市場定位。

3. 我去哪

行業知識圖譜在貝殼的應用實踐 5

通過融合後的行業數據圖譜對行業整體進行分析,可以清楚的看到市場潛在的增長空間和增長方向,從而更好的設定自己的發展目標和價值追求點。比如貝殼找房的願景是服務2億家庭的品質居住平台。

行業知識圖譜解決問題的思路

1. 做什麼

行業知識圖譜在貝殼的應用實踐 6

經過自我剖析和了解市場後,可以製定明確的發展目標和具體實現的步驟、方案,以及合理的效果評價,從而形成一個正向的循環過程。

行業知識圖譜在貝殼的應用實踐 7

舉例來說,通過行業圖譜,明確了貝殼找房發展的價值空間,如房源量預計可以年增長11%。基於此便可以製定公司層面的核心目標,比如GMV的年增長率。再然後到具體的業務部門,為了促進GMV的增長,可能需要提高差異化的房源增量線索供給。進一步的,依據業務目標就可以製定技術目標,即搭建我們的情報分析平台,以及引入更多的數據。

2. 怎麼做

首先需要有一套知識圖譜技術應用的框架:

行業知識圖譜在貝殼的應用實踐 8

具體有:

  • 智能問答:比如對話助手,智能客服,和經紀人的知識賦能。
  • 智能推理:基於圖譜的關聯關係進行推薦搜索,並給出排序理由,以及利用智能推理實現文本生成。
  • 社區發現:有風控預警,用戶畫像,和知識融合。

有了技術平台後,便可以構建情報系統。包括提供給決策者或作業人員使用的提效工具,以及線索增量和大盤決策等應用。

3. 做啥樣

通過算法,數據和應用,構建起整體的技術平台:

行業知識圖譜在貝殼的應用實踐 9

重點是要評價目標的達成效果和目標設定本身。從而解決垂直領域在情報上的欠缺。

行業數據引入的邏輯和方法

行業知識圖譜在貝殼的應用實踐 10

為了構建行業知識圖譜,需要引入的外部數據有以下五個方面:

  • 對標競品:競爭對手的產品情況。
  • 專業內容:房地產政策,如金融,原材料,宏觀經濟情況。
  • 上下游:開發商,物業,建築商等。
  • 環境周邊:醫院,學校等POI點
  • 用戶群體:長租住戶,短租住戶等

數據加工的過程和實體融合

行業知識圖譜在貝殼的應用實踐 11

通常引入的不同來源的數據格式多種多樣,因此需要經過數據清洗和實體融合的過程。對於貝殼找房來說,重點融合小區,樓棟,門店,指標體系這幾方面的數據。

小區的融合:貝殼目前的覆蓋的小區有40多萬,只占到70%左右。通過數據融合,得到全國小區73萬,準確率有98%。從而確定貝殼在小區維度之後的發展方向。

門店的融合:因為成交數據難以獲取到,通常採用門店數據量的對比間接評價與競品之間的價值比例。

行業圖譜的建立和情報分析的過程

1. 行業圖譜的建立

行業知識圖譜在貝殼的應用實踐 12

目前,貝殼構建好的行業圖譜包含的三元組數量有480億。實體類型有經紀人,門店,學校,公園,房源,購物中心,幼兒園等140多個類別,主要採用其中高頻的60多個。關係數量有230個,加上屬性有1800個左右。目前採用的存儲平台從以前的Neo4j和JanusGraph,逐漸遷移到Dgraph。

圖譜建立的難點在於如何構建圖譜的關聯關係,因此需要相關的業務專家支持才能做好實體的屬性。另外,通過在公司層面建立圖譜編輯平台,從而統一不同部門的所構建的圖譜本體。

2. 情報分析的能力

行業知識圖譜在貝殼的應用實踐 13

通過構建好的圖譜,可以大大提高情報分析的能力,主要包括三個方面:

提效:包括報盤匹配和門店選址兩個應用。報盤匹配是將成交的房源與具體的門店進行關聯,之前主要由經紀人來完成,現在通過圖譜,可以實現90%-80%的準召率;門店選址是通過對某個區塊內的門店數,商業體,人流量等進行加權計算,從而得到給定區域可以容納的商家數,以及最佳選址。該功能目前還在研發中。

增量:由於某些小區沒有在內部掛牌,或者地址不准確,可能導致搜索沒有數據,從而不能進行相應的關聯推薦。但通過情報系統可以了解到其他商家掛牌的小區,從而更好的輔助經紀人作業。

決策:GMV數據通常不能直接得到,但可以通過掛牌數,門店數和經紀人作業情況等數據來模擬得到GMV數據,從而為貝殼的進一步發展給予指導。

行業知識圖譜在智能應用上的作用和表現

行業知識圖譜在貝殼的應用實踐 14

目前基於貝殼行業知識圖譜開發的應用有:

小貝助手:IM場景下基於三元組的知識問答。當經紀人接受多個客戶的同時諮詢時,可以對客戶問題進行相應答案的提示,從而提高經紀人的回答準確率,為經紀人提效。

搜索效果:當搜索不到任何結果時,可以推薦對應的站外熱度,相關房源和對應的地址。

AI講房:主要是VR看房場景的文稿自動生成。

今天的分享就到這裡,謝謝大家。

作者介紹

孫拔群,貝殼找房行業知識圖譜負責人

本文來自 DataFunTalk

原文鏈接

https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247498789&idx=1&sn=b41dc6bcc64a56b1f7f4ae18810ba980&chksm=fbd74e49cca0c75f1bb4cfde02c6f4d797731d7cb1207dcad67167ec1bfadc58cd7b49ff8fb7&scene=27#wechat_redirect