Categories
程式開發

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級?


新技術浪潮正推動著工業製造行業飛速革新,並以人工智能技術為代表,引領著第四次工業革命的進程,“AI+工業”正逐漸成為第四次工業革命的主力軍。 9月23日,英特爾舉辦了“智能製造,’芯’向未來——智能技術助力工業製造勾畫未來藍圖”為主題的圓桌論壇,邀請其客戶和合作夥伴分享工業智能化升級的實際案例。

本案例中,英特爾聯合美的,推出工業視覺檢測雲平台。利用英特爾的至強可擴展處理器平台、OpenVINO 工具套件英特爾發行版(以下簡稱“OpenVINO 工具套件”)、Analytics Zoo “大數據分析+AI” 平台等一系列產品與技術,為智能方案成功實施和運行提供了堅實基礎。通過這些高性能硬件基礎設施和軟件框架,企業的生產和運營可以實現從自動化向智能化的轉變。

項目背景

美的集團(以下簡稱“美的”)希望通過完整、可複制的產品缺陷檢測方案,來完善其智能製造產業鏈中的關鍵環節。如前面提到的,由工業相機、工控機以及機器人組成的傳統視覺方案存在諸多問題,例如定制化方案開發週期長、成本高,檢測內容多樣化造成參數標定繁瑣、工人使用困難,佔用產線空間大,對工藝流程有影響。因此,美的希望通過新的技術方法來優化和升級檢測方案,打造以下能力:

  • 對單個檢測項目形成通用的推理算法,並可推廣至不同產線;
  • 可在任何產線上做到無縫部署,不干擾現有生產和工藝流程;
  • 在無人工干預情況下做到高魯棒性,並在全天候高頻次下, 保證準確率和延遲的穩定;
  • 整個檢測過程在100 毫秒以內完成,識別率達到98% 以上。

來自生產一線的海量數據資源,讓美的具備了利用AI 技術, 特別是深度學習方法,來解決上述問題的基礎,並通過與英特爾展開深入的技術合作,提升了算法和算力。如圖2-1-5 所示, 美的通過前端高清圖像採集、後端訓練推理的架構,構建了基於深度學習的工業視覺檢測雲平台,為旗下各產線提供瑕疵檢測、工件標定、圖像定位等一系列輔助檢測能力。

在這一過程中,英特爾不僅為新方案提供了Analytics Zoo 大數據分析和 AI平板,來構建從前端數據預處理到模型訓練、推理, 再到數據預測、特徵提取的全流程,還針對美的各生產線的實際檢測需求,為新方案選擇了輕銳的SSDLite + MobileNet V2 算法模型並實施優化,令新方案進一步提升了效果。

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 1

基於Analytics Zoo 的端到端解決方案

如前所述,美的設計的機器視覺檢測雲平台架構主要由前、後端兩部分組成,由工業相機、工控機等設備構成圖像採集前端, 部署在工廠產線上,經云化部署的英特爾架構服務器集群則組成雲平台的後端系統。

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 2

在前端,執行圖像採集的機器人通常裝有多個工業相機,或進行遠距離拍攝,用於檢測有無和定位;或進行近距離拍攝,用於光學字符識別(Optical Character Recognition,OCR)。以微波爐划痕檢測為例,如圖2-1-6 所示,當系統開始工作時, 通過機器人與旋轉台的聯動,先使用遠距離相機拍攝微波爐待檢測面的全局圖像,並檢測計算出需要進行OCR 識別的位置, 再驅動近距離相機進行局部拍攝。相機採集到的不同圖像,先由搭載英特爾酷睿處理器的工控機進行預處理,根據檢測需求確定需要傳輸到雲端后,再將數據傳送到後端雲服務器, 實施深度學習訓練和推理。

雖然這一架構並不復雜,但新方案要達到美的希望的靈活、敏捷和高通用性卻並非易事。尤其是以端到端方式構建從數據採集、模型訓練、算法部署的全流程,如果中間每個環節都由美的自行建設,勢必會耗費大量的時間和開發成本,且容易造成軟硬件緊耦合和擴展性差的問題。

Analytics Zoo 融合了Apache Spark、TensorFlow、BigDL 等多種技術框架,可直接運行在英特爾架構服務器構建的大數據集群上,並可通過對英特爾至強可擴展處理器進行深度優化,充分釋放強大的性能潛力。同時,Analytics Zoo 所集成的英特爾數學核心函數庫(Intel Math Kernel Library,英特爾MKL)與多線程技術,也幫助美的工業視覺檢測雲平台大幅提升特徵訓練、圖片預測以及數據批處理等效率。

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 3

通過雙方的緊密合作,英特爾幫助美的在其新方案後端的雲服務器中,基於Analytics Zoo 構建了端到端數據分析流水線方案。整個方案流程如圖2-1-7 所示,包括以下幾個主要步驟:

  1. 通過Spark,方案以分佈式方式處理來自各產線工業相機獲取的大量視頻和圖像。其中,Analytics Zoo 使用PySpark 從磁盤中讀取視頻或圖像數據並進行預處理,構造出TensorFlow Tensor 的彈性分佈式數據集(Resilient Distributed DataSet,RDD)。整個訓練流程可以自動從單個節點擴展到基於英特爾架構服務器的大型Hadoop / Spark 集群,無需修改代碼或手動配置。

  2. 使用TensorFlow 目標檢測API 接口,直接構建對象檢測模型,例如,可以採用輕量級的SSDLite + MobileNet V2 模型。

  3. 直接使用在第一步中預處理的圖像RDD,以分佈式方式在Spark 集群上訓練(或微調)對象檢測模型。例如,為了以分佈式方式處理缺陷檢測流水線的訓練數據,方案使用PySpark 將原始圖像數據讀取到RDD 中,然後應用一些變換來解碼圖像,並提取邊界框和類標籤。方法如下所示:

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 4

而返回的RDD(train_rdd)中的每條記錄都包含一個NumPy ndarray 的列表(即圖像、邊界框、類和檢測到的框的數量), 它可以直接用於創建TensorFlow 模型,並在Analytics Zoo 上進行分佈式訓練。通過創建TFDataset(如下所示),可以實現這一功能。

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 5

  1. 訓練結束後,可以基於與訓練流程類似的流水線,直接使用RDD 評估圖像數據集,使用PySpark、TensorFlow 和BigDL 在Analytics Zoo 上,以分佈式方式在Spark 集群上執行大規模模型評估(或推理);

  2. 使用Analytics Zoo 中POJO 模式的API, 將整個Pipeline 輕鬆地部署於在線Web 服務中,以實現低延遲的在線服務(例如,Web 服務、Apache Storm、Apache Flink 等)。實現代碼如下:

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 6

更多有關詳細信息,請參閱:https://analytics-zoo.github.io/master/#Programming指南/推斷/

通過這樣的方法,新方案可以對預處理過的圖像進行識別, 提取出需要進行檢測的標的物,例如螺釘、銘牌標貼或型號等, 並通過不斷地迭代分佈式訓練提高對檢測物的識別率。最後, 系統會將識別結果傳遞給機械臂等自動化設備來執行下一步動作。值得一提的是,英特爾至強可擴展處理器為新方案提供了另一項關鍵要素:計算力。部署在該雲平台中的英特爾至強可擴展處理器得到了充分的性能優化,其英特爾高級矢量擴展512(Intel Advanced Vector Extensions 512,英特爾AVX-512)等技術以出色的並行計算能力,滿足了該雲平台在模型訓練和模型推理時對算力的需求。

基於英特爾架構優化的目標檢測算法模型

如前文所述,提升基於機器視覺的工業輔助檢測系統的工作效能,關鍵在於為其選擇高效、適宜的目標檢測。美的的新方案選擇了更適於實時目標檢測的SSDLite + MobileNet V2模型。

利用Analytics Zoo,新方案使用TFDataset 來表示一個分佈式存儲的記錄集合,每條記錄包含一個或多個TensorFlow Tensor 對象。這些Tensor 被直接用作輸入, 來構建TensorFlow 模型。如以下代碼所示,方案通過TensorFlow Object Detection API 構建了SSDLite + MobileNet V2 模型:

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 7

在模型構建之後,方案首先加載預先訓練的TensorFlow模型, 然後使用Analytics Zoo 中的TFOptimizer,通過以下方式對模型進行微調訓練:

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 8

最終方案在驗證數據集上的成效可達0.97 [email protected]

方案成效

將深度學習的方法引入工業輔助檢測領域,不僅讓美的工業視覺檢測雲平台可以快速、敏捷、自動地識別出待測產品可能存在的問題,例如螺釘漏裝、銘牌漏貼、LOGO 絲印缺陷等。更重要的是,該雲平台能夠良好適應非標準變化因素,即便檢測內容和環境發生變化,雲平台也能很快適應,省去了冗長的新特徵識別、驗證時間。同時,這一方案也能有效地提高檢測的魯棒性,克服了傳統視覺檢測過於依賴圖像質量的問題。

新方案在美的產線中實際部署後,達到了很好的應用效果。從已有9 條產線的實際部署測試數據來看,該方案對現有產線的影響幾乎為零。同時,由Analytics Zoo 提供統一的數據分析+ AI 平台,大幅降低了方案進行分佈式訓練和推理以及提供低延遲在線服務所耗費的人力物力成本。相比傳統的工業視覺方案,如圖2-1-8 所示,項目部署週期縮短了57%,物料成本減少30%,人工成本減少70% 。

美的如何利用英特爾“AI+大數據”平台實現工業智能化升級? 9

同時,經英特爾優化的SSDLite + MobileNet V2 目標檢測算法模型也有效提升了方案的執行效率和準確率。來自一線的數據表明,方案對諸多缺陷的識別率達到了99.98%,推理預測時間從原先的2 秒縮減到現在的124 毫秒。

更多示例以及優化細節,請參閱Github 相關代碼: https://github.com/intel-analytics/analytics-zoo/blob/master/pyzoo/zoo/examples/tfnet/train_lenet.py