인공지능/빅데이터 SQL

2. 데이터 모델링이란?

백관구 2022. 7. 5. 20:03
반응형

모델링의 특징

모델링의 정의

  • 추상화(= 모형화)
    • 현실세계를 일정한 형식에 맞추어 표현을 함.
  • 단순화
    • 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 함.
  • 명확화
    • 대상에 대한 애매모호함을 제거하고 정확하게 현상을 기술함.

데이터 모델링의 이유

  • 정보들을 일정한 표기법에 의해 표현함으로써 정보시스템 구축의 대상이 되는 업무 내용을 정확하게 분석하기 위함.
  • 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터 관리에 사용하기 위함.

데이터 모델링의 유의점

  • 중복
    • 중복을 최소화 해야 함.
    • 데이터베이스가 여러 장소에 같은 정보를 저장하지 않도록 함.
  • 비유연성
    • 데이터의 정의와 사용 프로세스를 분리하여 유연성을 높여야 함.
    • 데이터 혹은 프로세스의 변화가 애플리케이션과 데이터베이스에 중대한 변화를  일으킬 수 있는 가능성을 줄임.
    • 그렇지 않은 경우, 업무 변화에 따라 데이터 모델이 수시로 변경됨으로써 유지보수에 어려움을 가중시킬 수 있음.
  • 비일관성
    • 데이터 간의 상호 연관관계를 명확히 정의하여 일관성 있게 데이터가 유지되어야 함.
    • 데이터의 중복이 없어도 비일관성은 발생 가능함.
    • 예를 들어 고객의 신용 상태에 대한 갱신 없이 고객의 납부 이력 정보를 갱신하는 경우, (신용 상태)-(납부 이력) 간 상호 연관관계가 모순되는 문제 발생함.

데이터 모델링의 3단계 과정

  • 현실에서는 개념적 데이터 모델링 → 논리적 데이터 모델링 → 물리적 데이터 모델링 순으로 수행하는 경우는 드물며, 개념적/논리적 데이터 모델링을 함께 수행하는 경우가 대부분임.
데이터 모델링 설명 추상적 수준 구체적 수준
개념적 - 업무중심적이고 포괄적인 수준의 모델링 진행함.
- 전사적 데이터 모델링, 전사아키텍처 수립시 이용함.
높음 낮음
논리적 - 시스템으로 구축하고자 하는 업무에 대해 Key, 속성, 관계를 정확하게 표현함. 중간 중간
물리적 - 실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계함. 낮음 높음
  1. 개념적 데이터 모델링
    • 핵심 엔터티와 그들 간의 관계를 발견하고, 엔터티-관계 다이어그램을 생성함.
    • 엔터티-관계 다이어그램 : 조직과 데이터베이스 사용자에게 어떤 데이터가 중요한지 나타내기 위해 사용됨.
    • 사용자와 시스템 개발자가 데이터 요구 사항을 발견하는 것을 지원함.
    • 현 시스템이 어떻게 변형되어야 하는가를 이해하는데 유용함.
  2. 논리적 데이터 모델링
    • 비즈니스 정보의 논리적인 구조와 규칙을 명확하게 표현하는 기법임.
    • 데이터 모델링 과정에서 핵심이 되는 부분임.
    • 식별자 확정, 정규화, M:M 관계 해소, 참조 무결성 규칙 정의로 상세화 하고, 이력 관리에 대한 전략을 정의함.
    • 정규화 : 일관성을 확보하고 중복을 제거하여 속성들이 적절한 엔터티에 배치되도록 함으로써 신뢰성 있는 데이터 구조를 얻음.
  3. 물리적 데이터 모델링
    • 테이블, 컬럼 등 물리적인 저장구조와 사용될 저장 장치, 자료를 추출하기 위해 사용될 접근 방법이 결정됨.

데이터베이스의 3단계 구조

  • ANSI/SPARC 3단계 구성의 데이터 독립성 모델은 외부 단계, 개념적 단계, 내부 단계로 구성되어 서로 간섭되지 않는 모델을 제시함.
  • 데이터 독립성 단계별 요소
    • 각 스키마 구조는 상호 독립적이며 고유한 기능을 가짐.
스키마 설명 비고
외부 - 여러 개의 사용자 관점으로 구성되며, 개별 사용자, 응용프로그래머가 접근하는 개인적 데이터베이스 스키마임. 접근하는 특성에 따른 스키마 구성
개념 - 모든 응용시스템이나 사용자가 필요로 하는 데이터를 통합한 조직 전체의 데이터베이스를 기술함.
- 데이터베이스에 저장되는 데이터와 그들간의 관계를 표현하는 스키마임.
통합 관점
내부 - 물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 스키마임. 물리적 저장구조

 

참고자료 : DATA ON-AIR

반응형