인공지능 52

Kaggle 타이타닉(문제 정의~데이터 전처리)

데이터 분석 코드 필사 (2020.07.22)¶- 원본: Titanic Data Science Solutions (by Manav Sehgal)¶- 순서¶1. 문제 정의¶2. 훈련, 테스트 자료 정의¶3. 데이터 분석¶4. 데이터 전처리¶ 문제 정의¶1912년 4월 15일 타이타닉 호가 북대서양 해상에서 유빙과 충돌해 가라앉는 사고가 발생전체 2224 명의 승객들 중 1502 명의 사망자를 기록 (32% 생존율)높은 사망율은 부족한 구명선 때문특정 그룹(예: 어린이, 상류층)의 생존율이 비교적 높았음문제: 타이타닉 승객 정보를 이용해 타이타닉 사고로 인한 생존/사망 여부를 예측하는 것이 목적훈련 자료: 타이타닉에 승선한 승객 정보와 사고로 인한 생존/사망 여부의 정보테스트 자료: 오직 승객 정보만 훈련,..

파이썬으로 .wav 파일 읽기

안녕하세요 :) 데이콘 대회를 준비하던 중 음성 데이터(.wav)를 처리해야 해서 이것저것 시도해보다가 가장 간단한 방법을 찾았습니다. scipy 패키지를 사용하면 손쉽게 wav 파일을 읽을 수 있습니다. from scipy.io import wavfile path = "음성 자료 경로" fname = "음성 파일명.wav" fs, data = wavfile.read(path + fname) # Sample rate of wav file, Data read from wav file scipy.io 패키지에서 wavfile이라는 모듈을 임포트 해오면 wavfile.read("파일 이름") 함수를 통해 쉽게 .wav 파일을 수치화한 형태로 읽을 수 있습니다. 여기서 저장되는 fs와 data는 각각 해당 음성..

반응형