기초 7

2. 데이터 모델링이란?

모델링의 특징 추상화(= 모형화) 현실세계를 일정한 형식에 맞추어 표현을 함. 단순화 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현하여 쉽게 이해할 수 있도록 함. 명확화 대상에 대한 애매모호함을 제거하고 정확하게 현상을 기술함. 데이터 모델링의 이유 정보들을 일정한 표기법에 의해 표현함으로써 정보시스템 구축의 대상이 되는 업무 내용을 정확하게 분석하기 위함. 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터 관리에 사용하기 위함. 데이터 모델링의 유의점 중복 중복을 최소화 해야 함. 데이터베이스가 여러 장소에 같은 정보를 저장하지 않도록 함. 비유연성 데이터의 정의와 사용 프로세스를 분리하여 유연성을 높여야 함. 데이터 혹은 프로세스의 변화가 애플리케이션과 데이터베이스에 ..

파이썬 vim 설정 (.vimrc)

리눅스 OS에서 작업할 때, 편집기로 사용하는 vim vim의 설정을 조금만 바꿔주면 훨씬 편리한 코딩을 경험할 수 있다. 1단계. 설정파일(.vimrc) 생성 사용자 폴더(예를 들어 /home/사용자명)로 이동한 후 .vimrc 파일을 만들어준다. $ vim .vimrc 2단계. 설정 입력 위 명령어 입력 후 파일이 열릴텐데, 아래 내용들을 입력해준다. if has("syntax") syntax on endif filetype plugin indent on set autoindent set expandtab set ts=4 set shiftwidth=4 set bg=dark set nu set cursorline 각 설정에 대한 설명은 다음과 같다. syntax on : 구문(문법) 색상 강조 file..

9-2. 독립동일분포(표본평균의 분포)

표본평균의 분포란? 서로 독립이고 동일한 확률분포를 따르는 확률변수 $X_1, X_2, ..., X_n$의 표본평균 $\bar{X}$이 따르는 분포. 이 분포는 모평균의 구간추정이나 모평균의 검정에서 사용. 표본평균의 기댓값과 분산 확률변수 $X_1, X_2, ..., X_n$이 기댓값이 $\mu$, 분산이 ${\sigma}^2$인 확률 분포를 따를 때, $$E(\bar{X})=\mu$$ $$V(\bar{X})=\frac{{\sigma}^2}{n}$$ 표본평균의 분포 원래 분포가 뭐였든 간에(정규 분포, 포아송 분포), 표본평균의 분포는 표본 크기가 커짐에 따라 정규 분포에 가까워짐. 중심극한정리(Central limit theorem) 확률변수 $X_1, X_2, ..., X_n$이 서로 독립이고, 동..

과학/통계 2020.10.06

9-1. 독립동일분포(독립성, 합의 분포)

소개¶ 이 장에서 살펴볼 확률변수는 서로 독립인 다차원 확률변수. 독립: 확률변수가 다른 확률변수에 영향을 끼치지 않음. 독립동일분포(i.i.d.; independently and identically distributed): 서로 독립이고 각각 동일한 확률분포를 따르는 다차원 확률변수. 동일한 조건 아래에서 수행되는 실험이나 관측을 여러 번 반복하여 데이터를 얻는 것. 예: 우연히 만난 20명의 학생에게 시험 점수를 물어본 경우, 학생 한 명의 점수 각각은 전교생의 점수 분포를 따르는 1차원 확률변수, 어떤 학생을 만나기 직전에 만났던 학생과 전혀 관계없이 만난 학생이므로, 우연히 만난 20명의 점수는 서로 독립인 20차원의 확률변수 (독립동일분포). 확률분포 $F$: $X_1, X_2, ..., X_..

과학/통계 2020.09.15

6. 이산형 확률분포

6단원. 이산형 확률분포¶ 추측 통계의 목표: 한정된 표본으로부터 모집단의 평균, 분산을 추정 모수적 기법: 이 때 모집단이 어떠한 성질일 것이므로 이러한 형태를 지닌 확률분포일 것이다라는 가정을 하고, 확률분포의 기댓값과 분산을 결정하는 파라미터를 추측 비모수적 기법: 모집단의 확률분포에 어떠한 가정도 하지 않음 파라미터만 추측하면 되니까 추정이 간단하고 분석이 쉬운 모형을 만들 수 있다! 다양한 확률분포, 특히 이산형 확률분포에 대해 소개 각각의 확률분포를 어떠한 상황에서 사용하는지 설명 6.1. 베르누이 분포(Bernoulli distribution)¶ 확률변수가 취할 수 있는 값이 0과 1밖에 없는 분포 1이 나오는 확률을 $p$, 0이 나오는 확률을 $1-p$ 파라미터: $p$ $$ f(x)= ..

과학/통계 2020.08.14
반응형