과학 7

[황사 연구] 한국기상학회 2022 가을학술대회

국가기상위성센터 운고계 후방산란계수를 활용한 황사 탐지 (이선용, 신유림, 송병현, 김윤재) 국립기상과학원 기상청 기후예측시스템(GloSea6) 기반의 황사 계절 전망 연구 (강미선, 이우정) 한국형 전지구 앙상블모델 기반의 황사확률예측시스템 구축 (김미경, 조정훈) 황사발원지에서의 실지(in-situ)관측을 통한 황사 발원과 미기상학적 요소와의 비교 (정민재, 유희정, 오상민, 주승진, 고희정, 김정은, 부경온) 대학 동아시아 지역에서 관측된 겨울철 강한 황사 사례: 박스 모형 기반 먼지 배출 방안의 민감도 실험 (이재형, 이상현) 주성분분석(PCA)을 이용한 황사 종관패턴 분류에 영향을 미치는 주요 변수 식별 (이승연, 윤지원, 박선기) 황사 예측 개선을 위한 환경위성의 에어로졸 광학두께 자료동화 (..

과학/황사 2023.02.07

샘플링 전략 (Sampling Strategy)

안녕하세요 :) 이번 포스팅은 샘플링 전략(Sampling Strategy)에 대해 알아보려고 합니다. 실무에서 한정된 데이터를 갖고 모델의 성능을 검증하고자 할 때, 데이터의 대표성을 확보하는 일은 매우 중요합니다. 어떻게 데이터를 선택(추출)해서 검증했는지에 따라 신뢰를 얻을 수도, 한순간에 신뢰를 잃을 수도 있기 때문입니다. 이 때 데이터에서 샘플을 적절하게 추출하는 방법에 관한 수립 전략을 샘플링 전략이라고 합니다. 표본 조사 샘플링 전략은 표본 조사라고 하는 통계 분석에서 활용됩니다. 먼저 표본 조사가 무엇인지 아래의 사례를 통해 알아보겠습니다. 어떤 과학자가 "우리나라 대기 중에 떠다니는 미세먼지의 평균 농도가 얼마나 되는지"를 주제로 연구를 한다고 가정 하겠습니다. 이번 연구의 정확한 정답을..

과학/통계 2023.01.30

황사의 정의

안녕하세요 :) 2023년 새해가 밝았습니다. 어느덧 1월도 절반이 지나고 입춘(立春)이 다가오고 있습니다. "봄" 하면 어떤 분위기를 떠올리시나요? 먼저 유채꽃 밭, 벚꽃 길, 소풍처럼 따사롭고 밝은 느낌이 떠오릅니다. 그리고 봄의 불청객 "황사"가 생각납니다. 실제로 지난 30년 간(1993~ 2022년) 계절별 황사 발생 일수를 보면 (아래), 평균적으로 봄에 7일 정도 황사가 관측되는 것을 확인할 수 있습니다 (출처 : 기상청 기상자료개방포털). 반면, 다른 계절에는 여름 0일, 가을 0.7일, 겨울 1.3일로 비교적 드물게 발생했던 것을 알 수 있습니다. 그렇다고 봄에 반드시 황사가 관측되는 것은 아닙니다. 연도에 따른 계절별 황사 발생 일수를 보면 (아래) 지난 30년 동안 1994년, 201..

과학/황사 2023.01.19

9-2. 독립동일분포(표본평균의 분포)

표본평균의 분포란? 서로 독립이고 동일한 확률분포를 따르는 확률변수 $X_1, X_2, ..., X_n$의 표본평균 $\bar{X}$이 따르는 분포. 이 분포는 모평균의 구간추정이나 모평균의 검정에서 사용. 표본평균의 기댓값과 분산 확률변수 $X_1, X_2, ..., X_n$이 기댓값이 $\mu$, 분산이 ${\sigma}^2$인 확률 분포를 따를 때, $$E(\bar{X})=\mu$$ $$V(\bar{X})=\frac{{\sigma}^2}{n}$$ 표본평균의 분포 원래 분포가 뭐였든 간에(정규 분포, 포아송 분포), 표본평균의 분포는 표본 크기가 커짐에 따라 정규 분포에 가까워짐. 중심극한정리(Central limit theorem) 확률변수 $X_1, X_2, ..., X_n$이 서로 독립이고, 동..

과학/통계 2020.10.06

9-1. 독립동일분포(독립성, 합의 분포)

소개¶ 이 장에서 살펴볼 확률변수는 서로 독립인 다차원 확률변수. 독립: 확률변수가 다른 확률변수에 영향을 끼치지 않음. 독립동일분포(i.i.d.; independently and identically distributed): 서로 독립이고 각각 동일한 확률분포를 따르는 다차원 확률변수. 동일한 조건 아래에서 수행되는 실험이나 관측을 여러 번 반복하여 데이터를 얻는 것. 예: 우연히 만난 20명의 학생에게 시험 점수를 물어본 경우, 학생 한 명의 점수 각각은 전교생의 점수 분포를 따르는 1차원 확률변수, 어떤 학생을 만나기 직전에 만났던 학생과 전혀 관계없이 만난 학생이므로, 우연히 만난 20명의 점수는 서로 독립인 20차원의 확률변수 (독립동일분포). 확률분포 $F$: $X_1, X_2, ..., X_..

과학/통계 2020.09.15

6. 이산형 확률분포

6단원. 이산형 확률분포¶ 추측 통계의 목표: 한정된 표본으로부터 모집단의 평균, 분산을 추정 모수적 기법: 이 때 모집단이 어떠한 성질일 것이므로 이러한 형태를 지닌 확률분포일 것이다라는 가정을 하고, 확률분포의 기댓값과 분산을 결정하는 파라미터를 추측 비모수적 기법: 모집단의 확률분포에 어떠한 가정도 하지 않음 파라미터만 추측하면 되니까 추정이 간단하고 분석이 쉬운 모형을 만들 수 있다! 다양한 확률분포, 특히 이산형 확률분포에 대해 소개 각각의 확률분포를 어떠한 상황에서 사용하는지 설명 6.1. 베르누이 분포(Bernoulli distribution)¶ 확률변수가 취할 수 있는 값이 0과 1밖에 없는 분포 1이 나오는 확률을 $p$, 0이 나오는 확률을 $1-p$ 파라미터: $p$ $$ f(x)= ..

과학/통계 2020.08.14

1. 데이터

1.1. 데이터의 크기 데이터의 수 (샘플 수) 변수의 수 (차원): 어떤 데이터에 변수가 5개 있으면 5차원 1.2. 변수의 종류 1.2.1. 질적 변수와 양적 변수 질적 변수 예: 만족도 설문조사, 혈액형 이진 변수: 값이 2개뿐인 변수 (예: 성별, 흡연 여부) 명의 척도 단순 분류를 위한 변수 (예: 전화번호, 성별) 변수의 동일성 여부에만 의미가 있음: 대소 관계, 사칙연산 의미 X 순서 척도 순서 관계나 대소 관계에 의미가 있는 변수 (예: 성적 순위, 만족도) 대소 관계에 의미는 있으나, 사칙연산 의미 X 양적 변수 양을 표현 (예: 시험 점수, 키) 간격 척도 대소 관계와 함께 차이도 의미를 갖는 변수 (예: 연도, 온도) 섭씨 60도와 섭씨 30도의 대소 관계, 차이는 의미가 있으나, 섭..

과학/통계 2020.07.29
반응형