pandas 전처리 간편 코드(1)

2023. 8. 8. 11:21data analysis/전처리

library import


  
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline
import warnings
warnings.filterwarnings('ignore')
plt.rcParams['font.family'] = 'AppleGothic' #시각화 한국어 에러(맥북)

 

group by


  
talk_df.groupby(['연령','감정_대분류']).count() #다른 항목도 다 포함
talk_df.groupby(['연령', '감정_대분류']).size().unstack(fill_value=0) #선택한 컬럼 위주

before
after

데이터 수정 및 병합


  
# 컬럼명 바꾸기
df.rename(columns = {'컬럼a':'수정_컬럼a', '컬럼b':'수정_컬럼b'}, inplace = True)
#변수값 바꾸기
df.replace({'컬럼명': 값}, 바꿀 값)
df.loc[df['Emotion'] == '행복', 'Emotion'] = '기쁨'
#랜덤추출
df.sample(1000)

 

csv파일 저장


  
#csv 파일명 지정
csv_filename = '파일명.csv'
add_df.to_csv(csv_filename, index=True)