Python 21

파이썬 vim 설정 (.vimrc)

리눅스 OS에서 작업할 때, 편집기로 사용하는 vim vim의 설정을 조금만 바꿔주면 훨씬 편리한 코딩을 경험할 수 있다. 1단계. 설정파일(.vimrc) 생성 사용자 폴더(예를 들어 /home/사용자명)로 이동한 후 .vimrc 파일을 만들어준다. $ vim .vimrc 2단계. 설정 입력 위 명령어 입력 후 파일이 열릴텐데, 아래 내용들을 입력해준다. if has("syntax") syntax on endif filetype plugin indent on set autoindent set expandtab set ts=4 set shiftwidth=4 set bg=dark set nu set cursorline 각 설정에 대한 설명은 다음과 같다. syntax on : 구문(문법) 색상 강조 file..

텐서플로우(Tensorflow) 자동 미분과 사용자정의 훈련

12.3.8. 자동 미분을 사용하여 그래디언트 계산하기¶ 자동 미분이란?¶ 신경망처럼 수만 개의 파라미터를 가진 복잡한 함수의 도함수(미분, 그래디언트)를 쉽게 계산할 수 있도록 해주는 도구 tensorflow.GradientTape() 을 활용 예시: $w_1 = 5, w_2 = 3$ 일 때 도함수는 각각 36과 10임을 미분을 통해 구함 $$f(w_1, w_2) = 3w_1^2 + 2w_1w_2$$$${df \over {dw_1}} = 6w_1 + 2w_2$$$${df \over {dw_2}} = 2w_1$$ In [1]: import tensorflow as tf w1, w2 = tf.Variable(5.), tf.Variable(3.) # 두 변수 w1과 w2를 정의 def f(w1, w2): #..

간단한 자연어 처리 모델

In [1]: from IPython.core.display import display, HTML display(HTML("")) 필요한 라이브러리 임포트¶ In [2]: import tensorflow as tf from tensorflow.keras import preprocessing, layers 입력 및 라벨 데이터 생성¶ In [3]: samples = ["너 오늘 이뻐 보인다", "나는 오늘 기분이 더러워", "끝내주는데, 좋은 일이 있나봐", "나 좋은 일이 생겼어", "아 오늘 진짜 짜증나", "환상적인데, 정말 좋은거 같아"] labels = [[1], [0], [1], [1], [0], [1]] 전처리¶ In [4]: tokenizer = preprocessing.text.Tokeni..

9-1. 독립동일분포(독립성, 합의 분포)

소개¶ 이 장에서 살펴볼 확률변수는 서로 독립인 다차원 확률변수. 독립: 확률변수가 다른 확률변수에 영향을 끼치지 않음. 독립동일분포(i.i.d.; independently and identically distributed): 서로 독립이고 각각 동일한 확률분포를 따르는 다차원 확률변수. 동일한 조건 아래에서 수행되는 실험이나 관측을 여러 번 반복하여 데이터를 얻는 것. 예: 우연히 만난 20명의 학생에게 시험 점수를 물어본 경우, 학생 한 명의 점수 각각은 전교생의 점수 분포를 따르는 1차원 확률변수, 어떤 학생을 만나기 직전에 만났던 학생과 전혀 관계없이 만난 학생이므로, 우연히 만난 20명의 점수는 서로 독립인 20차원의 확률변수 (독립동일분포). 확률분포 $F$: $X_1, X_2, ..., X_..

과학/통계 2020.09.15

6. 이산형 확률분포

6단원. 이산형 확률분포¶ 추측 통계의 목표: 한정된 표본으로부터 모집단의 평균, 분산을 추정 모수적 기법: 이 때 모집단이 어떠한 성질일 것이므로 이러한 형태를 지닌 확률분포일 것이다라는 가정을 하고, 확률분포의 기댓값과 분산을 결정하는 파라미터를 추측 비모수적 기법: 모집단의 확률분포에 어떠한 가정도 하지 않음 파라미터만 추측하면 되니까 추정이 간단하고 분석이 쉬운 모형을 만들 수 있다! 다양한 확률분포, 특히 이산형 확률분포에 대해 소개 각각의 확률분포를 어떠한 상황에서 사용하는지 설명 6.1. 베르누이 분포(Bernoulli distribution)¶ 확률변수가 취할 수 있는 값이 0과 1밖에 없는 분포 1이 나오는 확률을 $p$, 0이 나오는 확률을 $1-p$ 파라미터: $p$ $$ f(x)= ..

과학/통계 2020.08.14

Kaggle 타이타닉(문제 정의~데이터 전처리)

데이터 분석 코드 필사 (2020.07.22)¶- 원본: Titanic Data Science Solutions (by Manav Sehgal)¶- 순서¶1. 문제 정의¶2. 훈련, 테스트 자료 정의¶3. 데이터 분석¶4. 데이터 전처리¶ 문제 정의¶1912년 4월 15일 타이타닉 호가 북대서양 해상에서 유빙과 충돌해 가라앉는 사고가 발생전체 2224 명의 승객들 중 1502 명의 사망자를 기록 (32% 생존율)높은 사망율은 부족한 구명선 때문특정 그룹(예: 어린이, 상류층)의 생존율이 비교적 높았음문제: 타이타닉 승객 정보를 이용해 타이타닉 사고로 인한 생존/사망 여부를 예측하는 것이 목적훈련 자료: 타이타닉에 승선한 승객 정보와 사고로 인한 생존/사망 여부의 정보테스트 자료: 오직 승객 정보만 훈련,..

반응형