3과목 - 데이터베이스 구축
5장. 데이터 전환
115. 데이터 전환
데이터 전환의 정의
- 운영 중인 기본 정보 시스템에 축적되어 있는 데이터를 추출 (Extraction)하여 새로 개발할 정보 시스템에서 운영 가능하도록 변환 (Transformation)한 후, 적재 (Loading)하는 일련의 과정 (= ETL)
데이터 전환 계획서
- 데이터 전환이 필요한 대상을 분석하여 데이터 전환 작업에 필요한 모든 계획을 기록하는 문서
116. 데이터 전환 계획서 작성
데이터 전환 개요
- 데이터 전환 목표, 성공적인 데이터 전환을 주요 요인, 데이터 전환 작업을 위한 전제 조건 및 제약 사항 정의
- 데이터 전환 목표는 간단하고 명료하게 정의
데이터 전환 환경 구성
- 원천 시스템 구성도
- 원천 시스템의 서버, 스토리지, 네트워크 등을 포함한 구성도 작성
- 목적 시스템 구성도
- 목적 시스템의 서버, 스토리지, 네트워크 등을 포함한 구성도 작성
- 전환 단계별 DISK 용량 산정
- 전환 검증, 시험 단계, 본 전환 단계별로 요구되는 파일 공간과 DB 공간 산정
117. 데이터 전환 방안
데이터 전환 규칙
- 데이터 전환 과정에서 공통적으로 적용해야 할 규칙들 기술
데이터 전환 절차
- 데이터 전환 절차를 체계적이고 상세하게 기술
- 작업의 이해를 위한 데이터 흐름도 작성
데이터 전환 계획
- 데이터 전환 시간을 단축하기 위해 선 전환, 본 전환, 후 전환으로 분리하여 계획 수립
- 일자별 거래 내역, 근태 내역과 같은 대량의 데이터 테이블은 사전에 전환
118. 데이터 검증
데이터 검증
- 원천 시스템의 데이터를 목적 시스템의 데이터로 전환하는 과정이 정상적으로 수행되었는지 확인
검증 방법에 따른 분류
- 로그 검증 : 데이터 전환 과정에서 작성하는 추출, 전환, 적재 로그 검증
- 기본 항목 검증 : 로그 검증 외 별도로 요청된 검증 항목에 대해 검증
- 응용 프로그램 검증 : 응용 프로그램을 통한 데이터 전환의 정합성 검증
- 값 검증 : 숫자 항목의 합계 검증, 코드 데이터의 범위 검증 수행
검증 단계에 따른 분류
- 추출 : 원천 시스템 데이터에 대한 정합성 확인 (로그 검증)
- 전환 : 매핑 정의서에 정의된 내용이 정확히 반영되었는지 확인 (로그 검증)
- DB 적재 : 파일 적재하는 과정에서 발생할 수 있는 오류나 데이터 누락 여부 확인 (로그 검증)
- DB 적재 후 : 적재 완료 후 정합성 확인 (기본 항목 검증)
- 전환 완료 후 : 전환 완료 후 추가 검증 과정을 통해 데이터 전환의 정합성 검증 (응용 프로그램 검증)
119. 오류 데이터 측정 및 정제
오류 데이터 측정 및 정제의 개요
- 고품질의 데이터를 운영 및 관리하기 위해 수행
- 오류 데이터 측정 및 정제 순서
- 데이터 품질 분석
- 원천 및 목적 시스템 데이터의 정합성 여부 확인
- 오류 데이터 측정
- 정상 데이터와 오류 데이터의 수를 측정하여 오류 관리 목록 작성
- 오류 데이터 정제
- 오류 데이터를 분석하여 오류 상태, 심각도 및 해결 방안 확인
- 데이터 품질 분석
120. 데이터 정제요청서 및 정제보고서
데이터 정제요청서의 개요
- 오류 관리 목록을 기반으로 데이터 정제 요건 목록을 작성하고, 항목별로 데이터 정제요청서 작성
데이터 정제 요건 목록 작성
- 정제 유형
- 완전성 : 업무상 반드시 필요한 자료가 누락된 경우
- 유효성 : 항목의 값이 유효하지 않은 경우
- 일치성 : 상호 관련 있는 항목이 서로 다른 경우
- 유일성 : 서로 상이해야 하는 항목의 값이 동일한 경우
- 정제 방법
- 원천 : 원천 데이터의 정제가 필요한 경우
- 전환 : 전환 프로그램의 수정이 필요한 경우
- 모두 : 원천 데이터의 정제와 전환 프로그램의 수정이 모두 필요한 경우
데이터 정제보고서의 개요 및 작성
- 데이터 정제요청서를 통해 정제된 원천 데이터가 정상적으로 정제되었는지 확인한 결과를 문서로 작성
- 정제 요청 데이터와 정제된 데이터 항목을 육안으로 직접 비교하여 확인
- 정제된 데이터의 확인 결과를 반영한 데이터 정제보고서를 정제ID별로 작성