Data science/데이터 분석

데이터 품질 지수

보늴 2023. 7. 26. 14:04

Garbage in Garbage out, 데이터 분석하면서 가장 공감하는 말 중 하나이다.

데이터 품질이 좋고 양이 많아야 분석이든 모델링이든 가능하다.

제조업 현장에서는 특히 좋은 데이터 얻기가 한계점이 크다.

 

데이터 품질 지수를 평가하는 5가지 요소이다.

 

분석 이전 전처리 및 EDA 단계에서

위 항목으로 데이터 품질 평가후 진행하고자 한다.

특히 전처리 단계에서...원천 데이터가 한계가 있다해도

최대한 위 항목들을 유념하며 전처리 진행하는 것이 이후 분석에 용이하다.