반응형
Pandas는 데이터 사이언스에서 가장 많이 사용하고 중요한 python library
관례상 pandas를 pd라고 부름
import pandas as pd
pandas에서 csv파일을 읽어오는 방법과 summary를 확인하는 방법
# 파일 주소를 변수로 저장한다
melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv'
# csv 파일을 읽어오는 명령어
melbourne_data = pd.read_csv(melbourne_file_path)
# summary를 확인하는 명령어
melbourne_data.describe()
describe 명령어를 사용했을 때 나오는 값 설명
count : non-missing values 몇 개 있는지 알려줌
mean : 평균값
std : standard deviation, 값들에 비해 얼마나 떨어져 있는가
min, 25%, 50%, 75%, max : 하위 몇 프로임. min은 꼴찌, 25%는 하위 25% ...
반응형
'Data Science' 카테고리의 다른 글
데이터 사이언스 독학 온라인 사이트 추천 - 코세라(Coursera) 딥 러닝(Deep learning) 앤드류 응(Andrew Ng) (0) | 2023.07.03 |
---|---|
비즈니스 분석(애널리틱스)를 나누는 3가지 단계 (데이터 분석가 희망자 필독) (0) | 2023.06.24 |
유명 리크루팅 회사 매니저가 챗GPT를 공부하는 4가지 이유 (1) | 2023.06.19 |
[3] 머신러닝 인트로 캐글 / Model Validation, train_test_split (0) | 2022.06.15 |
[2] 머신러닝 인트로 캐글 / columns 확인, dropna, prediction target, features, sklearn (0) | 2022.06.15 |
댓글