이전에 배운 숫자형 / 범주형 변수를 통해 단변량분석을 배울 수 있다. 숫자형 변수는 min, max, mean, std, 사분위수 등으로 정리 -> Histogram, Density plot, Box plot 등으로 시각화 범주형 변수는 빈도 수 / 비율 등으로 정리 -> Bar plot / Pie chart 등으로 시각화 환경 준비 단변량 분석 실습에 필요한 환경을 세팅해보자. 먼저 라이브러리를 불러오자. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 필요한 데이터셋을 불러오자. 유명한 데이터셋인 타이타닉이다. path = 'https://raw.githubusercontent.co..
데이터 시각화는 실무에서 정말 필수다. 발표할 때 ppt를 잘 만들어야 하듯이, 데이터를 시각화하여 한 눈에 알아볼 수 있도록 보여주는 것은 매우 중요하다. matplotlib으로 간단한 시각화에 대해 배워보자. matplotlib matplotlib은 matlab을 사용해 봤다면 쉽게 사용할 수 있는 라이브러리다. 아니어도 쉽게 배울 수 있으니 아래에서 한번 살펴보자. 환경 준비 1) 라이브러리 import pandas as pd import numpy as np import matplotlib.pyplot as plt# matplotlib의 pyplot을 불러오는 것 2) 데이터 공기 질 정보를 불러오겠다. path = 'https://raw.githubusercontent.com/DA4BAM/dat..
데이터 분석에서 흔히 시계열 데이터라는 말을 들을 수 있다. 시계열 데이터란 어떤 데이터를 의미할까? 행과 행 사이에 시간의 순서가 있고, 행과 행 사이 시간간격이 동일한 데이터를 "시계열 데이터"라 한다. 데이터 처리 시계열 데이터 처리를 연습해보자. 환경 준비 import pandas as pd import numpy as np 판다스와 넘파이를 불러와준다. sales = pd.read_csv("https://raw.githubusercontent.com/DA4BAM/dataset/master/ts_sales_simple.csv") products = pd.read_csv("https://raw.githubusercontent.com/DA4BAM/dataset/master/ts_product_mast..
AI 학습 시 데이터 전처리 등은 필수적이다. 데이터 처리에 대해 알아보자! 데이터 전처리 1) 데이터 구조 만들기 2) 모델링을 위한 전처리 데이터프레임 변경하기 데이터프레임의 column name을 변경해보자! 열 변경 - column 속성 변경 모든 열 이름을 변경할 때는 .columns에 리스트를 할당해준다. df.columns = ['total', 'day', 'time', 'month'] rename() 메소드 사용으로 딕셔너리를 활용하여 지정한 열 이름 변경이 가능하다. 단, 변경하지 않으려는 이름은 그대로 적어주어야 한다. df.rename(columns = {'total': 'total_size', 'day': 'date', 'time': 'time', 'month': 'wall'}, i..
분석할 수 있는 데이터 분석할 수 있는 데이터는 두 가지로 나뉜다 -> 수치형 / 범주형 범주형 데이터 질적 데이터(정성적 데이터) -> 수학 연산이 가능하지 않은 범주로 나뉘어지는 데이터 명목형 데이터와 순서형 데이터로 나눌 수 있다. - 명목형 데이터: 성별 등 (남성과 여성을 수학적으로 연산할 수 없다.) - 순서형 데이터: 연령대 등 (10대와 20대를 더한다고 해서 30대가 되진 않는다.) 수치형 데이터 양적 데이터(정량적 데이터) -> 수학 연산이 가능한 데이터 이산형 데이터와 연속형 데이터로 나눌 수 있다. - 이산형 데이터: 연속적이지 않은 데이터, 책의 페이지 수 등 - 연속형 데이터: 연속적인 데이터, 키, 온도 등 주의해야 할 점 범주와 수치로 나누긴 했지만, 질적 데이터가 모두 비 ..
STEP 1. Github 가입하기 예전에 만들어놓은 Github 아이디가 존재해서, 따로 추가 가입 없이 원래 아이디로 진행하겠다. 가입은 아래 사이트에서 하면 된다. https://github.com/ STEP 2. Repository 생성 Github 로그인을 하면 우측 상단에 + 버튼이 있고, 이를 클릭하면 New repository가 있다. 클릭 후 새 Repository를 생성해준다. Repository name에 생성할 레포의 이름을 적어주고, Public과 Private 중 선택을 한 후 맨 밑의 Create repository를 클릭하면 레포지토리가 생성된다. 이 때 Public은 모든 사람이 볼 수 있는, Private는 개인 또는 공유한 사람만 볼 수 있는 레포지토리를 의미한다. 나는..