Categories
程式開發

機器學習在高德地圖軌跡分類的探索和應用


1.背景

當我們打開導航,開車駛向目的地的過程中,有時候會碰到這樣的問題:前方明明沒有路,可能在施工封閉,可是導航仍然讓我們往前開車,以至於我們無法順利到達目的地。全國道路千千萬,每天都有巨量的道路變得不可通行,那麼如何動態的識別出哪些道路走不通了呢?

機器學習在高德地圖軌跡分類的探索和應用 1

圖中所示即為因封路事件導致的導航路線改變

道路不通往往導致該條道路汽車流量突然降低。監控汽車流量的變化是挖掘封路事件的重要指標。但是,目前業務中遇到的一個重要問題是,針對汽車無法通行的封路事件,行人、自行車可能都可以穿行,這些行人、自行車等的噪聲流量大大削弱了道路流量變化。

因此,如果能够对行人、自行车、汽车的轨迹进行分类,就可以对道路流量的噪声进行过滤,仅仅关注汽车流量,流量随着封路事件的变化将更为显著,从而便于道路封闭的挖掘。本文主要针对非机动车、机动车分类探索轨迹分类问题。

2.樣本獲取與標籤制定

由於軌跡數據缺少原始真值,我們將用戶導航模式作為軌跡分類的偽標籤。例如當時用戶採用汽車導航,其軌跡對應的標籤即為汽車。由於汽車導航數據遠遠多於非機動車,不同偽標籤樣本比例差異巨大,存在嚴重的樣本不平衡問題。此外,用戶導航模式與用戶實際出行方式可能並不一致。比如有些用戶可以根據汽車導航步行到達目的地。下文介紹的標籤- 概率混合貝葉斯模型 將分析並試圖解決上述2個問題。

原文鏈接:【https://www.infoq.cn/article/wPm1R7khOQxA8wh8R7Zj】。未經作者許可,禁止轉載。