본문 바로가기
Data Science

[1] 머신러닝 인트로 캐글 / pandas csv파일 읽어오기,describe()

by Ju.D 2022. 6. 15.
반응형

Pandas는 데이터 사이언스에서 가장 많이 사용하고 중요한 python library

관례상 pandas를 pd라고 부름

import pandas as pd

pandas에서 csv파일을 읽어오는 방법과 summary를 확인하는 방법

# 파일 주소를 변수로 저장한다
melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv'
# csv 파일을 읽어오는 명령어
melbourne_data = pd.read_csv(melbourne_file_path)
# summary를 확인하는 명령어
melbourne_data.describe()

 

describe 명령어를 사용했을 때 나오는 값 설명

count : non-missing values 몇 개 있는지 알려줌

mean : 평균값

std : standard deviation, 값들에 비해 얼마나 떨어져 있는가

min, 25%, 50%, 75%, max : 하위 몇 프로임. min은 꼴찌, 25%는 하위 25% ...

반응형

댓글