개인정보, 데이터, 정보화

데이터 품질진단 절차 및 기법

데이터 품질진단 절차 및 기법
0 6,797

데이터 품질진단은 해당 조직이 운영ㆍ관리하고 있는 정보 시스템에 저장된 정형⋅비정형 데이터의 품질을 측정하여 현재의 수준을 평가하고 품질 저하의 요인을 분석하여 개선 사항을 제안하는 절차이다. 따라서 데이터 품질진단은 데이터 품질관리 활동의 일환으로 전개되는 것이 바람직하다.
데이터와 관련된 품질진단의 종류는 크게 데이터 값 진단, 데이터 구조 진단, 데이터 관리 프로세스 진단 등으로 구분할 수 있다.

 

품질진단 계획수립 절차
품질진단 계획수립 절차

정형 데이터에 대한 데이터 값 진단은 운영 데이터베이스의 테이블ㆍ컬럼ㆍ코드ㆍ관계ㆍ업무규칙을 기준으로 데이터의 값에 대한 현상을 분석한다. 또한 데이터 값과 관련된 품질기준을 적용하여, 오류내역을 산출하고 주요 원인을 분석하여 개선 사항을 제안한다. 특히 데이터 값과 관련된 오류는 데이터의 구조ㆍ흐름 통제ㆍ관리 프로세스와 연관되어 발생한다. 초기 구조 설계 오류ㆍ일관성 결여ㆍ관리 프로세스 결여ㆍ오너쉽 결여 등으로 인하여 낮은 품질의 데이터가 지속적으로 발생할 수 있다. 따라서 데이터 값 진단의 개선사항은 그 오류발생 원인 분석에 따라 값의 정제 외에도 구조 개선사항ㆍ데이터 흐름통제ㆍ관리 프로세스의 개선사항이 포함된다.

비정형 데이터에 대한 데이터 값 진단은 비정형 콘텐츠 자체의 상태와 메타데이터에 대한 데이터 품질진단으로 이루어진다. 비정형 콘텐츠 자체의 상태에 대한 진단은 그 내용 자체의 합목적성을 비롯하여 동영상, 이미지, 3D 등 비정형 콘텐츠 유형 따라 각기 다른 관점에서 작성된 콘텐츠의 상태를 시각이나 청각, 또는 자동화된 도구를 이용하여 진단한다. 메타데이터의 경우는 콘텐츠 파일 자체에 저장되는 메타데이터와 정형 데이터의 형식으로 데이터베이스에 별도 저장되는 메타데이터로 구분하여 주로 데이터베이스에 별도 저장된 메타데이터에 대하여 정형 데이터와 유사한 기준과 방법에 의해 진단을 수행한다. 또한 정형 데이터에 대한 진단에서와 마찬가지로 비정형 콘텐츠 유형별로 관련된 품질기준을 적용하여, 오류내역을 산출하고 주요 원인을 분석하여 개선 사항을 제안하는 절차가 포함된다.

데이터 구조 진단은 데이터 모델링 관점에서 데이터 품질을 진단한다. 특히 중요 업무 데이터베이스의 리버스 모델링(Reverse Modelling)을 통하여 논리 모델을 작성하고, 현행 데이터베이스의 구조 무결성ㆍ데이터 구조 표준화ㆍ관리 수준ㆍ변경 관리 등의 현황을 진단한다. 구조 진단의 주요 이슈는 데이터의 표준화 수준, 표준 코드, 표준 도메인, 테이블․컬럼 및 관계 정의, 정규화 수준 등이 이에 해당된다. 데이터 구조 진단은 주로 정형 데이터에 대해 이루어지나 비정형 데이터의 메타데이터에 대해서도 수행될 수 있다.

데이터 관리 프로세스 진단은 정형ㆍ비정형 데이터에 대한 현행 데이터 관리 프로세스를 분석하여 문제점을 도출하고, 이를 개선할 수 있는 핵심 업무 프로세스를 표준화하여 재설계한다. 이때 조직 역량분석을 통해 단계적 품질관리 이행 전략을 수립하는 절차를 제안할 수 있다. 데이터 관리 프로세스 진단과 관련된 주요 이슈는 품질관리 정책 수립ㆍ업무 프로세스의 적절성 및 운영성 분석ㆍ프로세스별 오너쉽 등으로 볼 수 있다.

데이터 값, 데이터 구조 및 데이터 관리 프로세스가 모두 건실해야 데이터 품질을 보장할 수 있다. 데이터 구조나 관리 프로세스에 문제가 있으면 당연히 데이터 값의 품질이 떨어지고, 데이터 관리 프로세스가 없는 조직에서 높은 품질의 데이터 값이나 구조를 기대할 수 없다. 데이터 값, 데이터 구조 및 데이터 관리 프로세스는 데이터 품질 측면에서 상호 긴밀한 관계를 갖는다.


붙임자료 : 데이터 품질진단 절차 및 기법 v1.0

이 웹 사이트에서는 사용자 환경을 개선하기 위해 쿠키를 사용합니다. 우리는 당신이 괜찮다고 생각하겠지만, 당신이 원한다면 거절할 수 있습니다. 동의 더 읽기