공부 23

Dask #5. 파이썬 Dask Bag

이번 포스팅에서는 파이썬 Dask Bag를 활용한 간단한 예제를 다뤄보도록 하겠습니다. 목차¶ Dask Bag Dask 클라이언트 JSON 데이터 읽기 Map, Filter, Aggregate 변환 및 저장 Dask Bag¶ Dask Bag은 map, filter, groupby, 그 외 집계 작업처럼 파이썬 컬렉션 객체에 대해 수행할 수 있는 여러 작업들을 구현해놓았습니다. 이 작업들을 수행하기 위해 Python 반복자(iterators)를 사용하여, 적은 메모리에서도 병렬 작업을 수행합니다. 이러한 점은 병렬 버전의 Itertools 또는 PySpark RDD와 유사합니다. 특히 로그 파일, JSON records, 사용자 정의 Python 객체에 대해 간단한 전처리를 수행하는 데에 이 Dask Ba..

Dask #4. 파이썬 Dask Array

이번 포스팅에서는 파이썬 Dask Array를 활용한 간단한 예제를 다뤄보도록 하겠습니다. 목차¶ Dask Array Dask 클라이언트 난수 배열 생성 메모리에 데이터 유지 Dask Array¶ Dask array는 위 그림과 같이 NumPy array 덩어리(chunk)가 격자 형태로 배열된 것으로 볼 수 있습니다. Dask array는 Numpy API의 대부분을 지원합니다. Dask 클라이언트¶ Dask 클라이언트(client)는 필요에 따라 실행해도 되고, 실행하지 않아도 됩니다. Dask 클라이언트는 연산 작업 현황에 대한 정보를 얻는데 유용한 대시보드(dashboard)를 제공합니다. 아래 코드와 같이 클라이언트를 생성하면 대시보드에 대한 링크가 표시됩니다. 이 링크를 클릭해, 작업을 실행하..

Dask #3. 파이썬 Dask 간단하게 사용해보기

목차¶ Dask DataFrame Dask Array Dask Bag Low-Level 인터페이스 : Dask Delayed 스케줄링 Client 진단 Dashboard 일반적으로 다음과 같이 Dask를 import 합니다. 작업 중인 데이터 유형(DataFrame, array, list)에 따라 이들 중 일부가 필요하지 않을 수도 있습니다. In [2]: import numpy as np import pandas as pd import dask.dataframe as dd import dask.array as da import dask.bag as db Dask DataFrame¶ Dask 객체 생성¶ 먼저, Dask DataFrame을 활용해 Pandas DataFrame 유형의 데이터를 작업해보도록..

Dask #2. 파이썬 Dask 설치 방법

이전 포스팅에서 다루었듯이, Dask는 파이썬 기반의 대규모 데이터 처리를 위한 병렬 컴퓨팅 라이브러리 입니다. 파이썬으로 분석 또는 개발을 하시면서, Pandas나 NumPy에 익숙한 데이터 분석가 및 엔지니어 분들이 쉽게 사용할 수 있도록 구현되어 있습니다. 이번 포스팅에서는 Dask를 사용하기 위해 Dask를 설치하는 방법에 대해 알아보겠습니다. Dask 설치 Dask는 현재 Linux, macOS 및 Windows에서 사용 가능합니다. Dask를 설치하기 위해 여러 방법이 있지만, 여기서는 pip를 사용하여 설치해보도록 하겠습니다. Dask Installation — Dask documentation .rst .pdf to have style consistency --> docs.dask.org ..

Dask #1. 파이썬 대규모 데이터 처리 Dask란?

파이썬에서 대규모 데이터 처리 및 분석을 하기 위한 Dask 라이브러리를 소개하려 합니다. Dask — Dask documentation .rst .pdf to have style consistency --> docs.dask.org Dask Dask는 Python의 병렬 연산을 위한 라이브러리입니다. 즉, 대규모 데이터의 처리·연산에 필요한 분산 환경을 사용자들이 쉽게 사용할 수 있도록 해주는 라이브러리로 보시면 됩니다. 이러한 Dask는 크게 두 파트 "동적 작업 스케줄링"과 "빅데이터 컬렉션"이라는 파트로 나누어 구성됩니다. 동적 작업 스케줄링은 실제 작업을 배정하고 실행하는 부분이고, 빅데이터 컬렉션은 스케줄링에서 실행할 작업을 구성하기 위해 필요한 분산 환경에 최적화된 여러 기능들을 제공하는 부..

An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale

논문명 - An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale 게재 일자 - 2021년 6월 3일 URL 링크 - https://arxiv.org/pdf/2010.11929.pdf Abstract 1. Introduction 2. Related Work 3. Method 3.1. Vision Transformer (ViT) 3.2. Fine-Tuning and Higher Resolution 4. Experiments 4.1. Setup 4.2. Comparison to State of the Art 4.3. Pre-Training Data Requirements 4.4. Scaling Study 4.5. Inspectin..

TRM (Technology Road Map; 기술 로드맵)

※ 출처 [기술력 UP!] 기술 경영을 지속하게 할 수 있는 도구--기술로드맵 올바른 정보를 수집하고 연구하여 산업 트렌드와 고객의 요구 사항의 변화를 예측해서 명확한 기술 로드맵을 세운다면 위기를 대비할 수 있을 뿐만 아니라 더욱 비즈니스가 번창할 수 있습니다 boardmix.com TRM (Technology Road Map; 기술 로드맵) - 미래 시장을 예측하고 미래 수요를 충족시키기 위해 향후 개발해야 할 제품과 필요 기술을 계획하고 최선의 대안을 선정하는 기술 기획 기법 - 기업이 미래의 목표 기술을 달성하기 위해 시간에 따른 시장, 제품, 기술의 발전 방향을 검토하고, 그들 간의 관계를 시각화하여 단계별 이정표 역할을 함 TRM의 필요성 - TRM을 통해 기술 부재와 리스크를 예측하고 전략적..

비즈니스/기획 2023.07.04

ICNet for Real-Time Semantic Segmentation on High-Resolution Images

논문명 - ICNet for Real-Time Semantic Segmentation on High-Resolution Images 저자 - Hengshuang Zhao, Xiaojuan Qi, Xiaoyong Shen, Jianping Shi, Jiaya Jia 게재 일자 - 2018년 8월 20일 URL 링크 - https://arxiv.org/pdf/1704.08545.pdf 1. Introduction 1.1. Status of Fast Semantic Segmentation 1.2. Our Focus and Contributions 2. Related Work 2.1. High Quality Semantic Segmentation 2.2. High Efficiency Semantic Segmen..

추천 시스템 기법 연구동향 분석

논문 명 - 추천 시스템 기법 연구동향 분석 (Review and Analysis of Recommender Systems) 저자 - 손지은, 김성범, 김현중, 조성준 게재 저널 - 대한산업공학회지 게재 일자 - 2015년 4월 15일 URL 링크 - http://koreascience.or.kr/article/JAKO201512053817215.page Review and Analysis of Recommender Systems -Journal of Korean Institute of Industrial Engineers | Korea Science Abstract The explosive growth of the world-wide-web and the emergence of e-commerce ha..

OpenCV를 사용한 이미지 이진화 (cv2.threshold, cv2.adaptiveThreshold)

안녕하세요:) 이번 포스팅에서는 OpenCV의 이미지 이진화에 대해 알아보겠습니다. 이진화 이진(Binary) 이미지는 모든 픽셀이 검정과 흰색으로만 표현된 이미지를 가리키며, 이렇게 이미지를 변환하는 과정을 이진화(Binarization)이라고 합니다. 컬러 이미지나 그레이 이미지를 검정과 흰색만 갖고 표현한다고 보시면 됩니다. 위 그림을 예시로 들어보겠습니다. 왼쪽 그림은 원본 컬러 이미지 입니다. 일반적으로 볼 수 있는 빨강(Red), 초록(Green), 파랑(Blue)의 3 채널로 구성되어 있습니다. 빨강, 초록, 파랑의 조합으로 모든 색을 표현하게 됩니다. 각 채널이 0부터 255까지 범위의 값을 갖는다고 하면, 검정색은 빨강 0 / 초록 0 / 파랑 0의 조합으로 만들고 흰색은 빨강 255 /..

반응형