반응형
모델링의 특징
- 추상화(= 모형화)
- 현실세계를 일정한 형식에 맞추어 표현을 함.
- 단순화
- 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 함.
- 명확화
- 대상에 대한 애매모호함을 제거하고 정확하게 현상을 기술함.
데이터 모델링의 이유
- 정보들을 일정한 표기법에 의해 표현함으로써 정보시스템 구축의 대상이 되는 업무 내용을 정확하게 분석하기 위함.
- 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터 관리에 사용하기 위함.
데이터 모델링의 유의점
- 중복
- 중복을 최소화 해야 함.
- 데이터베이스가 여러 장소에 같은 정보를 저장하지 않도록 함.
- 비유연성
- 데이터의 정의와 사용 프로세스를 분리하여 유연성을 높여야 함.
- 데이터 혹은 프로세스의 변화가 애플리케이션과 데이터베이스에 중대한 변화를 일으킬 수 있는 가능성을 줄임.
- 그렇지 않은 경우, 업무 변화에 따라 데이터 모델이 수시로 변경됨으로써 유지보수에 어려움을 가중시킬 수 있음.
- 비일관성
- 데이터 간의 상호 연관관계를 명확히 정의하여 일관성 있게 데이터가 유지되어야 함.
- 데이터의 중복이 없어도 비일관성은 발생 가능함.
- 예를 들어 고객의 신용 상태에 대한 갱신 없이 고객의 납부 이력 정보를 갱신하는 경우, (신용 상태)-(납부 이력) 간 상호 연관관계가 모순되는 문제 발생함.
데이터 모델링의 3단계 과정
- 현실에서는 개념적 데이터 모델링 → 논리적 데이터 모델링 → 물리적 데이터 모델링 순으로 수행하는 경우는 드물며, 개념적/논리적 데이터 모델링을 함께 수행하는 경우가 대부분임.
데이터 모델링 | 설명 | 추상적 수준 | 구체적 수준 |
개념적 | - 업무중심적이고 포괄적인 수준의 모델링 진행함. - 전사적 데이터 모델링, 전사아키텍처 수립시 이용함. |
높음 | 낮음 |
논리적 | - 시스템으로 구축하고자 하는 업무에 대해 Key, 속성, 관계를 정확하게 표현함. | 중간 | 중간 |
물리적 | - 실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계함. | 낮음 | 높음 |
- 개념적 데이터 모델링
- 핵심 엔터티와 그들 간의 관계를 발견하고, 엔터티-관계 다이어그램을 생성함.
- 엔터티-관계 다이어그램 : 조직과 데이터베이스 사용자에게 어떤 데이터가 중요한지 나타내기 위해 사용됨.
- 사용자와 시스템 개발자가 데이터 요구 사항을 발견하는 것을 지원함.
- 현 시스템이 어떻게 변형되어야 하는가를 이해하는데 유용함.
- 논리적 데이터 모델링
- 비즈니스 정보의 논리적인 구조와 규칙을 명확하게 표현하는 기법임.
- 데이터 모델링 과정에서 핵심이 되는 부분임.
- 식별자 확정, 정규화, M:M 관계 해소, 참조 무결성 규칙 정의로 상세화 하고, 이력 관리에 대한 전략을 정의함.
- 정규화 : 일관성을 확보하고 중복을 제거하여 속성들이 적절한 엔터티에 배치되도록 함으로써 신뢰성 있는 데이터 구조를 얻음.
- 물리적 데이터 모델링
- 테이블, 컬럼 등 물리적인 저장구조와 사용될 저장 장치, 자료를 추출하기 위해 사용될 접근 방법이 결정됨.
데이터베이스의 3단계 구조
- ANSI/SPARC 3단계 구성의 데이터 독립성 모델은 외부 단계, 개념적 단계, 내부 단계로 구성되어 서로 간섭되지 않는 모델을 제시함.
- 데이터 독립성 단계별 요소
- 각 스키마 구조는 상호 독립적이며 고유한 기능을 가짐.
스키마 | 설명 | 비고 |
외부 | - 여러 개의 사용자 관점으로 구성되며, 개별 사용자, 응용프로그래머가 접근하는 개인적 데이터베이스 스키마임. | 접근하는 특성에 따른 스키마 구성 |
개념 | - 모든 응용시스템이나 사용자가 필요로 하는 데이터를 통합한 조직 전체의 데이터베이스를 기술함. - 데이터베이스에 저장되는 데이터와 그들간의 관계를 표현하는 스키마임. |
통합 관점 |
내부 | - 물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 스키마임. | 물리적 저장구조 |
참고자료 : DATA ON-AIR
반응형
'인공지능 > 빅데이터 SQL' 카테고리의 다른 글
Dask #3. 파이썬 Dask 간단하게 사용해보기 (0) | 2023.08.18 |
---|---|
Dask #2. 파이썬 Dask 설치 방법 (0) | 2023.08.17 |
Dask #1. 파이썬 대규모 데이터 처리 Dask란? (0) | 2023.08.17 |
데이터 제공 사이트 (0) | 2023.07.31 |
1. 데이터베이스란? (0) | 2020.07.23 |