Python(6)
-
효율적인 프로젝트 관리를 위한 가상환경 구축 방법
가상환경은 프로젝트 또는 응용 프로그램을 위한 독립적인 환경을 구축하여 각각의 환경에서 필요한 라이브러리, 패키지, Python 버전 등을 분리하여 관리하는 것을 의미합니다. 이번 포스팅에서는 가상환경이 필요한 이유와 관련 명령어들을 정리해 보았습니다. 1. 가상환경 생성의 필요성 가상환경 생성의 중요성에 대해서는 많이들 알고 계실 텐데요, 가상환경 생성이 필요한 이유는 크게 3가지로 요약할 수 있습니다. (1) 패키지 및 라이브러리 버전 관리 : 서로 다른 프로젝트가 필요로 하는 라이브러리 버전 충돌을 방지하고, 각 프로젝트에 맞는 환경을 생성하여 버전 관리를 용이하게 함 (2) 프로젝트 분리 및 격리 : 각각의 프로젝트가 독립적인 환경에서 작동하여 서로 영향을 주지 않고 관리되도록 함 (3) 효율적인..
2023.12.11 -
pandas.date_range - 주기적인 날짜 데이터 생성하기
날짜 데이터의 간격이 규칙적이지 않은 경우를 다룰 때, 원하는 주기의 날짜 데이터를 생성하기 위해 pandas의 date_range 함수(메서드)를 활용할 수 있다. 이번 글에서는 date_range의 인자와 주기 설정에 따른 결과 차이에 대해 정리해보았다. 1. pandas.date_range() Return a fixed frequency datetimeIndex pandas.date_range( start=None, end=None, periods=None, freq=None, tz=None, normalize=False, name=None, closed=None, ) start / end: 날짜를 생성하기 위한 시작과 끝 값 (string or datetime 형식) periods: 생성하려는 날..
2022.07.05 -
[python] ConfigParser 이용한 외부인자 관리
분석환경(DB, Cloud server 등)에 접속하기 위해 코드 상에서 접속정보를 직접 입력하는 경우가 있다. 반복해서 사용되는 접속정보는 파일(.ini, .conf, .cfg 등)로 따로 저장하여 관리하는 것이 편리하다. 또한, github 연동을 통해 코드를 관리 하는 경우 해당 파일의 확장자를 .gitignore 파일에 추가하여 제외시키는 것이 보안상 안전하다. 저장된 파일의 접속정보를 가지고 올때, 파이썬의 configparser가 필요하다! 1. 설치 !pip install configparser 2. Config 파일 생성 원하는 경로에 config.ini (예시 파일)을 생성해보자. 생성 방법은 직접 작성하는 것과 코드를 이용한 작성 방법이 있다. # config.ini [db_config..
2022.06.07 -
[Python] strftime & strptime 비교 정리
날짜 및 시간은 표현 방법이 매우 다양하고, 입력 형식에 따라 string, numeric, datetime 과 같은 타입을 가질 수 있다. 이와 같은 날짜형 데이터를 원하는 형태로 변경하기 위해서 꼭 알아야할 메서드로 strftime 과 strptime 이 있다. 두 메서드의 차이를 이해하기 위해 이름의 의미와 역할에 대해 정리해보았다. 1. 요약 이름 (f/p) 역할 strftime f (format) datetime → string strptime p (parse) string → datetime 2. strftime strftime 은 날짜형 객체를 주어진 포맷의 문자열로 변환한다. (예시) from datetime import datetime dt = datetime(2022,5,1,12,30,..
2022.05.25 -
[Python] Powerful library for EDA - Pandas Profiling
데이터를 처음 접하게 되면 변수의 구성과 분포, 결측치, 상관관계 등 기본적으로 파악해야할 요소들이 많다. 이것은 EDA(Exploratory Data Analysis)의 첫 단계로 이 과정을 빠르게 도와주는 파이썬 라이브러리가 몇 가지 있다. Pandas Profiling Sweetviz DataPrep 여기서는 Pandas Profiling에 대해 정리해보려고 한다. 1. 설치 !pip install pandas-profiling 2. 활용 2.1. 데이터 불러오기 예제 데이터로 kaggle의 호주 강수 예측 데이터([1])를 사용하였다. import pandas as pd df = pd.read_csv('weatherAUS.csv') 2.2. 분석 보고서 생성하기 profile = df.profil..
2022.05.16 -
[Python] pandas.melt()
pd.melt() 함수는 여러 개의 열은 행으로 쌓아 하나의 열로 만들고 싶을 때 사용하면 좋은 함수이다. 알아두면 데이터 전처리에 유용하게 쓸 수 있다. 1. pandas.melt() Unpivot a DataFrame from wide to long format, optinally leaving identifiers set pandas.melt( frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True) id_vars : 인덱스 변수로 사용할 칼럼 value_vars : 하나의 열로 나열하고자 하는("unpivot") 칼럼 리스트/튜플/배열, 미지정시 id_vals를 ..
2022.05.10