基於Intel Analytics Zoo上分散式TensorFlow的美的 / KUKA工業檢測平臺

机器之心發表於2018-09-28

原文網址 : https://www.jiqizhixin.com/articles/2018-09-28-9

背景

工業檢查（用於產品缺陷檢測）是現代製造業的重要組成部分。隨著人工智慧，計算機視覺和大資料技術的發展，我們可以建立先進的工業檢測系統以實現和人類水平媲美的準確性，並具有更高的效率和更低的成本。在本文中，我們將分享我們在美的/ KUKA，使用英特爾Analytics Zoo（一個基於Apache Spark、TensorFlow和BigDL的開源資料分析+ AI平臺），來建立基於深度學習的工業檢測平臺的經驗。

基於Analytics Zoo的端到端的解決方案

為了便於構建和生成大資料的深度學習應用程式，Analytics Zoo（https://github.com/intel-analytics/analytics-zoo）提供了統一的資料分析+ AI平臺，可將Spark，TensorFlow和BigDL程式無縫整合到一個統一的資料分析流水線中；然後，整個流水線可以透明地擴充套件到（執行在標準的Intel至強伺服器上的）Hadoop / Spark叢集，以進行分散式訓練或推理。

基於Intel Analytics Zoo上分散式TensorFlow的美的 / KUKA工業檢測平臺

如上圖所示，美的/ KUKA的工業檢測平臺是一個建立在Analytics Zoo之上的端到端資料分析流水線，包括

（1）使用Spark以分散式方式處理從製造流水線獲取的大量影象。

（2）使用Tensorflow Object Detection API直接構建物件檢測（例如，SSDLite + MobileNet V2）模型

（3）直接使用在第一步中預處理的影象RDD，以分散式方式在Spark叢集上訓練（或微調）物件檢測模型。

（4）直接使用評估影象集的RDD，以分散式方式在Spark叢集上評估（或推斷）訓練模型。

（5）使用Analytics-Zoo中POJO模式的API, 將整個Pipeline部署在低延遲的、線上Web 服務中。

在檢測時間期間，具有相機的工業機器人可以自動拍攝產品的照片，並通過HTTP將影象傳送到網路服務以檢測各種缺陷（例如，缺失標籤或螺栓等），如下所示。

Spark，TensorFlow和BigDL的統一整合

如前所述，Analytics Zoo提供了“整合資料分析”的深度學習程式設計模型，因此使用者可以輕鬆開發端到端的資料分析+ AI流水線（使用Spark，TensorFlow，Keras等），然後透明地執行在大型Hadoop / Spark叢集上、使用BigDL和Spark進行分散式訓練和推理。此外，使用者還可以輕鬆部署端到端的流水線，以實現低延遲的線上服務（使用Analytics Zoo提供的POJO風格的模型服務API）。

例如，為了以分散式方式處理缺陷檢測流水線的訓練資料，我們可以使用PySpark將原始影象資料讀取到RDD中，然後應用一些變換來解碼影象，並提取邊界框和類標籤，如下所示。

<<<<

train_rdd = sc.parallelize(examples_list)

.map(lambda x: read_image_and_label(x))

.map(lambda image: decode_to_ndarrays(image))

<<<<

返回的RDD（train_rdd）中的每條記錄都包含一個NumPy ndarray的列表（即影象，邊界框，類和檢測到的框的數量），它可以直接用於建立TensorFlow模型，並在Analytics Zoo上進行分散式訓練。我們可以通過建立TFDataset（如下所示）來實現這一功能。

<<<<

dataset = TFDataset.from_rdd(train_rdd,

names=["images","bbox","classes","num_detections"],

shapes=[[300,300,3],[None,4], [None], [1)]],

types=[tf.float32, tf.float32, tf.int32, tf.int32],

batch_size=BATCH_SIZE,

hard_code_batch_size=True)

<<<<

在Analytics Zoo中，TFDataset表示一個分散式儲存的記錄集合，其中每條記錄包含一個或多個Tensorflow Tensor物件。然後我們可以直接將這些Tensor作為輸入構建Tensorflow模型。例如，我們使用了Tensorflow Object Detection API構建了SSDLite + MobileNet V2模型：

<<<<

# using tensorflow object detection api to construct model

# https://github.com/tensorflow/models/tree/master/research/object_detection

fromobject_detection.buildersimportmodel_builder

images,bbox,classes,num_detections=dataset.tensors

detection_model=model_builder.build(model_config,is_training=True)

resized_images,true_image_shapes=detection_model.preprocess(images)

detection_model.provide_groundtruth(bbox,classes)

prediction_dict = detection_model.predict(resized_images, true_image_shapes)

losses=detection_model.loss(prediction_dict,true_image_shapes)

total_loss=tf.add_n(losses.values())

>>>>

在模型構建之後，我們首先載入預先訓練的Tensoflow模型，然後使用Analytics Zoo中的TFOptimizer（如下所示）對模型進行微調訓練；最終我們在驗證資料集上達到0.97 mAP@0.5。

>>>>

with tf.Session()as sess:

init_from_checkpoint(sess, CHECKPOINT_PATH)

optimizer = TFOptimizer(total_loss, RMSprop(LR), sess)

optimizer.optimize(end_trigger=MaxEpoch(20))

save_to_new_checkpoint(sess, NEW_CHEKCPOINT_PATH)

>>>>

在執行過程中，Analytics-Zoo使用PySpark從磁碟中讀取了輸入資料並進行預處理，並構造了一個Tensorflow Tensor的RDD。然後，基於BigDL和Spark對Tensorflow模型進行分散式訓練（如BigDL技術報告所述）。無需修改程式碼或手動配置，整個訓練流程就可以自動從單個節點擴充套件到基於Intel至強伺服器的大型Hadoop / Spark叢集。

模型訓練結束後，我們還可以基於與訓練流程類似的流水線，使用PySpark，TensorFlow和BigDL在Analytics Zoo上執行大規模的分散式評估/推斷。

低延遲的線上服務

如下所示，我們也可以使用Analytics Zoo提供的POJO風格的模型服務API輕鬆部署推理流水線，以實現低延遲的線上服務（例如，Web服務，Apache Storm，Apache Flink等等）。有關詳細資訊，請參閱 https://analytics-zoo.github.io/master/#ProgrammingGuide/inference/

<<<<

AbstractInferenceModel model =new AbstractInferenceModel(){};

model.loadTF(modelPath,0,0,false);

List<List<JTensor>> output = model.predict(inputs);

<<<<

結論

Midea / KUKA通過結合人工智慧，計算機視覺和大資料技術，在Analytics Zoo（https://github.com/intel-analytics/analytics-zoo）上成功構建了先進的工業檢測系統。它使用了工業機器人，相機和英特爾至強伺服器等工具對產品的缺陷進行自動檢測。尤其是Analytics Zoo提供統一的資料分析+ AI平臺，可將Spark，BigDL和TensorFlow程式無縫整合到一個資料分析流水線中，從而可以輕鬆構建和生產化部署基於大資料的深度學習應用程式（包括分散式訓練和推理，以及低延遲線上服務）。您可以參考Github上的示例瞭解更多詳細資訊。

用 Intel Analytics Zoo/BigDL 為客服平臺新增 AI 的實踐（一）
2018-09-28
IntelAI
寶信利用Spark Analytics Zoo對基於LSTM的時間序列異常檢測的探索
2018-09-28
Spark
Analytics Zoo Cluster Serving自動擴充套件分散式推理
2020-09-19
套件分散式
基於工業資料的檢測分析
2018-09-17
Office Depot使用Apache Spark和Analytics Zoo上的分散式Keras實現實時產品推薦
2019-09-03
ApacheSpark分散式Keras
基於surging的木舟平臺如何分散式接入裝置
2024-12-01
分散式
使用Intel Analytics Zoo增強騰訊TUSI身份識別的實踐
2019-05-28
Intel
構建基於 HarmonyOS Next 的分散式工業監控系統
2024-11-16
分散式
鏈家分散式作業平臺
2018-11-12
分散式
英特爾貢獻基於 Kubernetes 分散式深度學習平臺：Nauta
2019-02-26
分散式深度學習
深度學習：基於K8S的分散式Tensorflow系統
2018-05-18
深度學習K8S分散式
Elixir 分散式平臺
2018-05-15
分散式
基於Celery在多臺雲伺服器上實現分散式
2020-09-05
伺服器分散式
分散式流平臺Kafka
2020-11-13
分散式Kafka
自動化功能測試平臺TestComplete的分散式測試教程（三）
2019-02-12
分散式
自動化功能測試平臺TestComplete的分散式測試教程（二）
2019-02-03
分散式
基於 Django 的 Dubbo 介面測試工具平臺
2020-09-23
Django
基於redis的分散式鎖
2018-06-28
Redis分散式
基於 Redis 的分散式鎖
2018-04-02
Redis分散式
基於kubernetes的分散式限流
2022-04-09
分散式
基於多工學習的智慧客服下文檢測方法
2019-05-30
TensorFlow分散式實踐
2019-01-16
分散式
tensorflow機器學習模型的跨平臺上線
2018-07-01
機器學習模型
基於java的分散式爬蟲
2018-07-06
Java分散式爬蟲
基於 dubbo 的分散式架構
2018-07-06
分散式架構
[原始碼解析] TensorFlow 分散式 DistributedStrategy 之基礎篇
2022-04-12
原始碼分散式
基於Spring Cloud Alibaba分散式架構資料平臺化(中臺)思想+多租戶saas企業開發架構
2021-12-03
SpringCloud分散式架構
基於 Redis 分散式鎖
2022-04-15
Redis分散式
浪潮分散式儲存助力江蘇省血液研究所搭建血液病檢測平臺
2022-05-22
分散式
基於工業網際網路平臺智慧製造方案【工業網際網路甄選聯盟】
2024-05-20
基於 RF 的 WEB 版自動管理測試平臺
2020-07-22
Web
Talroo使用Analytics Zoo和AWS利用深度學習在工作推薦上的應用
2019-04-12
深度學習
沒有完美的分散式架構
2022-07-08
分散式架構
阿里雲分散式容器平臺即將全面啟動公測！
2021-12-23
阿里分散式
工業閘道器在物聯網雲平臺上的作用
2022-11-14
測試平臺系列(87) 搞個精美的郵件模板
2022-01-05
[翻譯]基於redis的分散式鎖
2018-12-02
Redis分散式
基於zookeeper的分散式配置中心（一）
2019-05-19
分散式

基於Intel Analytics Zoo上分散式TensorFlow的美的 / KUKA工業檢測平臺

背景

基於Analytics Zoo的端到端的解決方案

低延遲的線上服務

結論

相關文章