🚨

Smart Factory 서비스를 위한 진동/압력/온도 센서의 Anomaly Detection 개발

분야
머신러닝
디지털 신호처리
no
4
세부 설명
■ 연구 내용 · NASA Bearing dataset의 진동(가속도) 센서(2개 진동센서 X 4개 베어링)로부터 수집된 시계열 data 기반으로 이상 탐지 (Anomaly Detection) 모델 개발 · 이상 탐지 모델의 구현 시, 데이터 전처리 작업은 FFT 또는 Wavelet 둘 중 하나로 수행을 권장 · 이상 탐지 모델의 구현 알고리즘은 지도 학습 또는 비지도 학습의 선택이 가능하나, 최소 2개 모델의 개발 및 테스트 후 결과 비교를 권장 (예를 들어, 비지도 학습 모델 2가지로 개발 후, 결과 특성을 비교) · NASA Bearing dataset으로 모델의 최적화 및 검증 후, 필요에 따라 2차 데이터 세트 NASA Turbofan Engine dataset으로 추가 테스트 및 검증 가능. 즉, 터보 팬 엔진에 부착된 진동(가속도), 압력, 온도 등 21개 센서로부터 수집된 시계열 data 기반으로 이상치 탐지(Anomaly Detection) 모델 테스트 및 검증 ■ 연구 목적 · Smart Factory(Data기반 지능형 공장)의 핵심은 예지 정비 (Predictive Maintenance) 솔루션/서비스 · 예지 정비는 공장내 설비 (모터, 펌프, 컴프레셔, 로봇 등) Data를 수집하고, 통계 분석, AI 분석을 통해 설비의 고장 (Failure) 이전에 이상치 탐지 (Anomaly Detection) 및 알람을 제공하여 정비 계획을 사전 수립하고 예기치 못한 Downtime을 예방함 · 따라서, 이 연구는 이상 탐지 모델의 성능 강화를 주목적으로 함 ■ 활용 계획 · 연구 결과를 SKT GrandView 서비스의 모델을 강화하는 기술로 활용 · (참고) SKT 'Metatron GrandView'서비스 ■ 관련 경험/역량 · 머신러닝, 딥러닝 모델 학습 경험 / Python Programming

01 멘토 소개

___.png

이광석

현재 예지 정비 (PdM, Predictive Maintenance) 기반 서비스, SKT GrandView 서비스의 사업화를 담당하고 있습니다. 이전에는 현장에서 솔루션 ML/DL 구축 PM을 담당했습니다.
현재 LS일렉트릭 자동화사업부, 동양, 중소기업부 중진공 등 다양한 대기업, 정부기관, 연구소, 관련 중소기업들과 협업하고 있습니다.
현장의 경험과 노하우를 공유하고, 본 프로젝트에 가이드와 멘토링에 최선을 다해 지원하겠습니다. 감사합니다.

02 프로젝트 소개

1) 개발 배경

이상 탐지는 예상에서 벗어난 비정상적인 패턴을 찾는 문제입니다. 이러한 이유로 기계 센서 모니터링, 휴먼 헬스 모니터링, 금융, 기후 변화, 통신 데이터에서 많이 활용되고 있습니다. 진동 신호를 포함한 기계로부터 센싱한 데이터들은 x축 시간에 따라 y축 frequency가 변화하는 시계열 데이터들 입니다.
진동 신호는 기계 상태를 모니터링하는 일반적인 센싱 방법입니다. 기계 고장으로 비상 알람이 발생하면 기계를 정지시킵니다. 기계를 정지시키는 이유는 진동이 높아져서 기계에 부하가 증가되기 때문입니다. 기계의 진동 신호가 높다는 것은 다른 큰 에너지를 발산한다는 것이고, 기계의 정상 회전 운동이 아니고, 다른 비정상적인 불안정한 상태를 알리는 신호입니다.
중환자실의 환자를 검사하듯이 기계설비도 진동신호로 검사를 하고 있습니다. 의료 진단과 기계설비 진단을 비교하면 청진기는 진동 검사와 비교할 수 있습니다, 피검사는 기계 윤활유 검사에 비교할 수 있고, X-Ray 검사는 기계 열화상 검사와 머신비전 검사에 비교할 수 있습니다. 의학과 기계학의 도메인 지식만 다를 뿐, 데이터기반 통계학습에서는 유사한 진단 방식 및 분류 문제로 접근할 수 있습니다.

2) 기대 효과와 연구 목표

기대 효과는 4가지 입니다.  기계 설비의 진동 검사를 통해 기계의 비정상, 이상치를 조기 발견함으로써 1) 정비 및 수리 계획을 사전에 수립하고 대응할 수 있으며 2) 예상치 못한 기계 설비의 비상 정지, Downtime을 예방할 수 있습니다. 3) 기계 설비의 수명을 연장하고,  4) PQCD(생산,품질,비용,납기)를 준수할 수 있습니다.
연구의 목표는 기계에 부착된 진동 센서로부터 기계 고장이 발생되기 2일전, 3일전에 기계의 비정상 시그널, 즉 이상치를 탐지하고, 알람을 주는 것입니다.
이상치의 임계값(Treshold) 설정 방식 (자유 또는 선택 가능)
- Variance : 정규분포에서 97.5% 이상 또는 2.5% 이하에 포함되는 값을 이상치로 판별
- 표준편차 방식 :  하한값 = 평균 - n * 표준편차,  상한값 = 평균 + n * 표준편차 (n은 3 or 2.75)
- Reconstruction Error : recon_error_train['Anomaly'] = recon_error_train['Loss_mae'] > recon_error_train['Threshold']  # THRESHOLD = 0.3
- 또는, 전통적으로 Raw data의 Waveform에서 early sign (노랑), waring sign (주황), critical sign (빨강 데이터 포인트) 으로도 추가 표현 등 가능
- Early anomaly sign : RMS X 1.5, Waring anomaly sign : RMS X 3, Critical anomaly sign : RMS X 4.5
- Anomaly -> Fault -> Failure 3단계 중, Anomaly Detection이 핵심이며, Fault Detection은 옵션이며, failure는 목표 타스크는 아닙니다.
모델의 평가 기준(Evaluation Metrics) : Reconstruction Error, Date of early anomaly sign, Date of waring anomaly sign, Date of critical anomaly sign, ...
모델의 선택 시, 최근 연구의 참고 (필수 아님, 자유 선택)
- VAE + 베어링데이터셋 : https://arxiv.org/abs/1912.01096
- GAN + 베어링데이터셋 : https://ieeexplore.ieee.org/document/8853246
- Meta Learing + 베어링데이터셋 : https://arxiv.org/abs/2007.12851

3) 개발 방향 및 연구 계획

퍼블릭 데이터 세트로 1차 NASA Bearing Dataset로 모델을 개발, 최적화, 검증 및 필요에 따라 2차로 NASA Turbofan Engine Dataset로 추가 모델 최적화, 검증
기계의 이상치를 조기 발견하기 위한 알고리즘 및 모델은 (a) 전통적으로 Fourier/Wavelet Transform 으로 데이터의 특징 추출을 위한 전처리 작업 후 (b) 트레이닝 단계에서 지도 학습의 또는 비지도 학습을 통해 모델을 생성합니다. (c) 그리고 나서, 임계치를 설정한 후, 생성된 학습 모델이 테스트 단계의 unseen data에서 이상치를 탐지합니다.
시계열 데이터의 Feature를 추출하는 전처리 작업은 FFT 또는 Wavelet 둘 중 하나로 수행을 권장 1. DWT (Discrete Wavelet Transform), 2. DFT (Discrete Fourier Transform), FFT (Fast Fourier transform), 3. SAX (Symbolic Aggregate Approximation) 등
이상치 탐지를 위한 지도 학습 방식으로 아래 방식을 추천 (또는 다른 모델 가능, 아래 아티클 참고) 1. Logistic Regression Model 2. Auto Regression Model (자기 회귀 모형) 3. Additive Regression Model (가산 회귀 모델, 페이스북 Prophet) 등
이상치 탐지를 위한 비지도 학습은 아래 방식을 추천 (또는 다른 모델 가능, 아래 아티클 참고) 1. linear model-based methods: PCA 2. distance-based mothods: KNN, CBLOF 3. probabilistic and density estimation-based methods: ABOD, FB 4. deep learning-based methods:  AE(Autoencoder), DAGMM, Variational AE, GAN
옵션으로 시계열 데이터의 저장을 위해 InfluxDB와 시각화를 위해 Grafana를 사용하여 어플리케이션 구현 가능 (아래 아티클 7. 참고)

4) SKT GrandView 소개 자료

소개서 (파일)
SKT그랜드뷰_중진공_발표_v.0423-2.pdf
3617.3KB
홍보 영상 (동양 예산공장)
개요도 (참고)
_1_SKT________1_(1).jpg
__SKT-LSE___2_0414_(1).jpg

5) 참고 아티클 (연구 계획서 작성 시 참고)

1. NASA 베어링 데이터 세트 : NASA Prognostic Data Repository의 4번 Bearing Dataset, Anomaly Detection Task에 적합. 라벨링이 안되어 있으며, 비지도 학습이 적합, Reconstruction Error의 정도를 임계치 기준 및 이상치로 판별 가능.
[참고] CWRU Dataset (Case Western Reserve University 베어링 데이터 세트), Fault Detection Task에 적합. 위의 NASA와 반대로 라벨링 되어 있으며, 지도 학습이 적합, Accuracy, Confusion matrix로 성능평가가 가능.
CWRU Dataset
CWRU Dataset 
CWRU Dataset Code
CWRU Dataset Code
2. NASA Bearing Dataset의 사용 방법, PCA, AE
3. 페이스북 리서치센터의 Prophet 라이브러리 소개와 아웃라이어 (유의 : Bearing Dataset 없음)
4. FFT, Logistic Regression using NASA Bearing Dataset
5. PCA, Mahalanobis Distance using NASA Bearing Dataset
6. DFT, AE using NASA Bearing Dataset
7. InfluxDB, Grafana 적용, 지도학습 Logistic Regression, 비지도학습 Kmeans, GMM 사용하여 모델 생성

03 이런 Fellow를 찾습니다.

능동적인 문제 해결자
함께 데이터에서 insights를 찾는 실무형 인재
스마트하게, 즐겁게, 그리고 함께 스터디, 데이터 분석, 코딩하실 인재