[Python Pandas] reshape을 자세히 알아보자(melt와 pivot)

2022. 12. 16. 20:52

참고 : 판다스 주요 명령어 모음집

https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

melt

파라미터 종류 : id_vars, value_vars, var_name, value_name

import pandas as pd

df=pd.DataFrame({'farm':['A농장','A농장','A농장','B농장','B농장','B농장','C농장','C농장','C농장'],
                 'produce' : ['토마토', '딸기', '마늘', '토마토', '딸기', '마늘', '토마토', '딸기', '마늘'],
                 'size':[10,7,3,9,6,2,8,5,1],
                'weight':[33,27,24,22,18,18,11,9,12]})
df

df.melt(id_vars = ['farm'])

variable, value 칼럼이 생겼다

farm 칼럼은 위치는 그대로이지만 값이 반복된다

produce, size, weight 칼럼이 variable 칼럼 값으로 들어갔다

그리고 그에 해당되는 실제 값들이 value에 들어갔다

*farm 칼럼의 값들은 variable에 맞게 반복된다

초록색을 produce, 주황색을 size, 파랑색을 weight 칼럼으로 보면 이해하기 쉬워진다

여기서 id_vars 파라미터에 produce 칼럼을 추가하면?

df.melt(id_vars = ['farm', 'produce'])

역시 variable, value 칼럼이 생겼다

farm, produce 칼럼은 위치는 그대로이지만 값이 반복된다

size, weight 칼럼이 variable 칼럼 값으로 들어갔다

그리고 그에 해당되는 실제 값들이 value에 들어갔다

*farm, produce 칼럼의 값들은 variable에 맞게 반복된다

df.melt(id_vars = ['farm', 'produce'],
        var_name='produce_char',value_name='real_value')

variable과 value 칼럼 이름을 바로 설정할 수 있다

pivot

파라미터 종류 : index, columns, values

import pandas as pd

df=pd.DataFrame({'farm':['A농장','A농장','A농장','B농장','B농장','B농장','C농장','C농장','C농장'],
                 'produce' : ['토마토', '딸기', '마늘', '토마토', '딸기', '마늘', '토마토', '딸기', '마늘'],
                 'size':[10,7,3,9,6,2,8,5,1],
                'weight':[33,27,24,22,18,18,11,9,12]})
df

df.pivot(index = 'produce',
         columns = 'farm',
         values = 'size')

df.pivot(index = 'produce',
         columns = 'farm',
         values = 'weight')

'What I study > Python_details' 카테고리의 다른 글

[Python] 코랩에 데이터(ex. csv 파일 등) 불러오기 (두 가지 방법) (0)	2022.12.12
[Python] value_counts() 와 sort_index() (0)	2022.12.12
[Python Numpy] np.concatenate()와 np.column_stack()의 차이점 (1)	2022.12.06
[Python Pandas] pandas 주요 명령어 모음집 (0)	2022.12.02
[Python] ModuleNotFoundError: No module named 'graphviz' 오류 해결하기 (0)	2022.11.01

데이터를 읽고쓰는 공간