데이터 입출력


데이터 전환 (1)

  • Name
    데이터 전환
    Type
    Description
    • 시스템에 축적되어 있는 데이터를 추출하여 새로 개발한 시스템에서 운영할 수 있도록 변환한 후, 적재하는 과정
    • 추출: Extraction, 변환: Transformation, 적재: Loading
    • 데이터 이행 또는 데이터 이관이라고 불린다.
  • Name
    데이터 전환 계획서
    Type
    Description
    • 데이터 전환이 필요한 대상을 분석하여 데이터 전환 작업에 필요한 모든 계획을 기록하는 문서
데이터 전환

데이터 검증 (2)

  • Name
    데이터 검증
    Type
    Description
    • 데이터 전환 과정이 정상적으로 수행되었는지 확인하는 과정
    • 데이터 검증은 검증 방법검증 단계에 따라 분류할 수 있다.
  • Name
    검증 방법
    Type
    Description
    • 로그 검증: 데이터 전환 과정에서 작성하는 추출, 전환, 적재 로그를 검증
    • 기본 항목 검증: 로그 검증 외 별도로 요청한 검증 항목에 대해 검증
    • 응용 프로그램 검증: 응용 프로그램을 통한 데이터 전환 정합성 검증
    • 응용 데이터 검증: 사전 정의된 업무 규칙을 기준으로 데이터 전환 정합성을 검증
    • 값 검증: 숫자 항목의 합계 검증, 코드 데이터의 범위 검증, 속성 변경에 따른 값 검증을 수행함
  • Name
    검증 단계
    Type
    Description
    • 추출: 원천 시스템 데이터에 대한 정합성 확인 (로그 검증)
    • 전환: 정의서에 정의된 내용이 정확히 반영되었는지 확인 (로그 검증)
    • DB 적재: SAM 파일을 적재하는 과정에서 발생할 수 있는 오류나 데이터 누락 여부 확인 (로그 검증)
    • DB 적재 후: 적재 완료 정합성 확인 (기본 항목 검증)
    • 전환 완료 후: 검증 과정을 통해 데이터 전환 정합성 검증 (응용 프로그램 검증, 응용 데이터 검증)
데이터 검증

오류 데이터 측정 및 정제 (3)

  • Name
    오류 데이터 측정 및 정제
    Type
    Description
    • 고품질 데이터 운영 및 관리

    진행 과정

    1. 데이터 품질 분석: 오류 데이터를 찾기 위해 데이터 정합성 여부 확인하는 작업
    2. 오류 데이터 측정: 데이터와 오류 데이터의 수를 측정하여 오류 관리 목록을 작성함
    3. 오류 데이터 정제: 오류 관리 목록의 각 항목을 분석하여 원천 데이터를 정의하거나 전환 프로그램을 수정
  • Name
    오류 상태
    Type
    Description
    • Open: 오류가 보고만 되고 분석되지 않은 상태
    • Assigned: 오류의 영향 분석 및 수정을 위해 개발자에게 오류 전달한 상태
    • Fixed: 개발자가 오류를 수정한 상태
    • Closed: 수정된 오류에 대한 테스트를 다시 했을 때 오류가 발견되지 않은 상태
    • Deferred: 오류 수정을 연기한 상태
    • Classified: 오류를 확인했지만 오류가 아님을 확인한 상태
  • Name
    데이터 정제 요청서
    Type
    Description
    • 데이터 정제와 관련된 전반적인 내용을 문서로 작성한 것
    • 오류 관리 목록을 기반으로 데이터 정제 요건 목록을 작성하고, 목록의 항목별로 데이터 정제 요청서를 작성한다.
  • Name
    데이터 정제 보고서
    Type
    Description
    • 정제된 원천 데이터가 정상적으로 정제되었는지 확인한 결과를 문서로 작성한 것
오류 데이터 측정 및 정제

데이터베이스 개요 (4)

  • Name
    데이터 저장소
    Type
    Description
    • 데이터들을 논리적인 구조로 조직화하거나, 물리적인 공간에 구축한 것
    • 논리 데이터 저장소: 데이터 및 데이터 연관성, 제약 조건을 식별해 논리적인 구조로 조직화 한 것
    • 물리 데이터 저장소: 논리 데이터 저장소를 소프트웨어가 운영될 환경의 물리적 특성을 고려하여 실제 저장장치에 저장한 것
  • Name
    데이터베이스
    Type
    Description

    공동으로 사용될 데이터를 중복을 배제하여 통합하고, 쉽게 접근하여 처리할 수 있도록 저장장치에 저장하여 항상 사용할 수 있도록 운영하는 운영 데이터

    • 통합된 데이터: 자료의 중복을 배제한 데이터 모임
    • 저장된 데이터: 컴퓨터가 접근할 수 있는 저장 매체에 저장된 자료
    • 운영 데이터: 조직의 고유한 업무를 수행하는 데 반드시 필요한 자료
    • 공용 데이터: 여러 응용 시스템들이 공동으로 소유하고 유지하는 자료
  • Name
    DBMS
    Type
    Description
    • 사용자의 요구에 따라 정보를 생성해주고, 데이터베이스를 관리해주는 소프트웨어
    • 기존 파일 시스템이 갖는 데이터의 종속성과 중복성의 문제를 해결하기 위해 제안된 시스템

    필수 기능 3가지

    1. 정의 기능: 데이터의 형(Type)과 구조에 대한 정의, 이용 방식, 제약 조건을 명시하는 기능
    2. 조작 기능: 데이터 검색, 갱신, 삭제, 삽입 등을 위해 인터페이스 수단을 제공하는 기능
    3. 제어 기능: 데이터의 무결성, 보안, 권한, 제어를 제공하는 기능
  • Name
    데이터의 독립성
    Type
    Description
    • 논리적 독립성과 물리적 독립성이 있다.

    논리적 독립성: 응용 프로그램과 데이터베이스를 독립시켜, 데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 영향을 받지 않음 물리적 독립성: 응용 프로그램과 보조기억장치 같은 물리적 장치를 독립시켜, 디스크를 추가/변경해도 응용 프로그램은 영향을 받지 않는다.

  • Name
    스키마
    Type
    Description
    • 데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술한 것

    외부 스키마: 사용자나 응용 프로그래머가 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의한 것 개념 스키마: 데이터베이스의 전체적인 논리적 구조 내부 스키마: 물리적 저장장치의 입장에서 본 데이터베이스의 구조

데이터베이스 개요

데이터베이스 설계 (5)

  • Name
    데이터베이스 설계
    Type
    Description
    • 사용자의 요구를 분석하여 그것들을 컴퓨터에 저장할 수 있는 데이터베이스의 구조에 맞게 변형한 후, DBMS로 데이터베이스를 구현하여 일반 사용자들이 사용하게 하는 것
  • Name
    데이터베이스 설계 시 고려사항
    Type
    Description
    • 무결성: 삽입, 삭제, 갱신 등 연산 후 데이터 베이스에 저장된 데이터가 정해진 제약 조건을 항상 만족해야 한다.
    • 일관성: 데이터는 특정 질의에 일정해야 한다.
    • 회복성: 시스템 장애 발생 후 복구했을 때, 데이터는 직접과 같아야 한다.
    • 보안성: 보호
    • 효율성: 응답시간 단축, 생산성, 공간 최적화 등
    • 확장성: 데이터를 지속적으로 추가할 수 있어야 한다.
  • Name
    데이터베이스 설계 순서
    Type
    Description
    1. 요구 조건 분석: 요구 조건 명세서 작성(데이터베이스 사용자 필요한 용도 파악)
    2. 개념적 설계: 개념 스키마, 트랜잭션 모델링, E-R 모델 (현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정)
    3. 논리적 설계: DBMS에 맞는 논리 스키마 설계, 트랜잭션 인터페이스 설계 (특정 DBMS가 지원하는 논리적 자료 구조로 변환 Mapping시키는 과정)
    4. 물리적 설계: DBMS에 맞는 물리적 구조의 데이터로 변환 (논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정)
    5. 구현: DBMS의 데이터 베이스 생성, 트랜잭션 작성 (논리적 설계와 물리적 설계에서 도출된 데이터베이스 스키마를 파일로 생성하는 과정)