[Python] Powerful library for EDA - Pandas Profiling
데이터를 처음 접하게 되면 변수의 구성과 분포, 결측치, 상관관계 등 기본적으로 파악해야할 요소들이 많다. 이것은 EDA(Exploratory Data Analysis)의 첫 단계로 이 과정을 빠르게 도와주는 파이썬 라이브러리가 몇 가지 있다. Pandas Profiling Sweetviz DataPrep 여기서는 Pandas Profiling에 대해 정리해보려고 한다. 1. 설치 !pip install pandas-profiling 2. 활용 2.1. 데이터 불러오기 예제 데이터로 kaggle의 호주 강수 예측 데이터([1])를 사용하였다. import pandas as pd df = pd.read_csv('weatherAUS.csv') 2.2. 분석 보고서 생성하기 profile = df.profil..
2022.05.16