pandas(3)
-
pandas.date_range - 주기적인 날짜 데이터 생성하기
날짜 데이터의 간격이 규칙적이지 않은 경우를 다룰 때, 원하는 주기의 날짜 데이터를 생성하기 위해 pandas의 date_range 함수(메서드)를 활용할 수 있다. 이번 글에서는 date_range의 인자와 주기 설정에 따른 결과 차이에 대해 정리해보았다. 1. pandas.date_range() Return a fixed frequency datetimeIndex pandas.date_range( start=None, end=None, periods=None, freq=None, tz=None, normalize=False, name=None, closed=None, ) start / end: 날짜를 생성하기 위한 시작과 끝 값 (string or datetime 형식) periods: 생성하려는 날..
2022.07.05 -
[Python] Powerful library for EDA - Pandas Profiling
데이터를 처음 접하게 되면 변수의 구성과 분포, 결측치, 상관관계 등 기본적으로 파악해야할 요소들이 많다. 이것은 EDA(Exploratory Data Analysis)의 첫 단계로 이 과정을 빠르게 도와주는 파이썬 라이브러리가 몇 가지 있다. Pandas Profiling Sweetviz DataPrep 여기서는 Pandas Profiling에 대해 정리해보려고 한다. 1. 설치 !pip install pandas-profiling 2. 활용 2.1. 데이터 불러오기 예제 데이터로 kaggle의 호주 강수 예측 데이터([1])를 사용하였다. import pandas as pd df = pd.read_csv('weatherAUS.csv') 2.2. 분석 보고서 생성하기 profile = df.profil..
2022.05.16 -
[Python] pandas.melt()
pd.melt() 함수는 여러 개의 열은 행으로 쌓아 하나의 열로 만들고 싶을 때 사용하면 좋은 함수이다. 알아두면 데이터 전처리에 유용하게 쓸 수 있다. 1. pandas.melt() Unpivot a DataFrame from wide to long format, optinally leaving identifiers set pandas.melt( frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True) id_vars : 인덱스 변수로 사용할 칼럼 value_vars : 하나의 열로 나열하고자 하는("unpivot") 칼럼 리스트/튜플/배열, 미지정시 id_vals를 ..
2022.05.10