카테고리 없음

[NIPA] 03 Pandas 심화 알아보기

parrot1007 2020. 10. 2. 19:35
반응형

[이론2] 함수로 데이터 처리하기

 

apply를 통해서 함수로 데이터를 다룰 수 있다.

df=pd.DataFrame(np.arange(5), columns=['Num"])
def square(x):
	return x**2
df['Num'].applu(square)
df['Square']=df.Num.apply(lambd x: x**2)
df=pd.DataFrame(columns=['phone']
df.loc[0]='010-1234-1235'
df.loc[1]='공일공-일이삼사-1235'
df.loc[2]='010.1234.일이삼오'
df['preprocess_phone']=''

그룹으로묶기:

df.groupby('key').sum()
df.groupby(['key','data1']).sum()

Aggregate: groupby를 통해서 집계를 한번에 계산하는 방법

get_group: groupby로 묶인 데이터에서 key값으로 데이터를 가져올 수 있다.

df=pd.read_csv('./univ.csv')
df.head()
df.groupby('시도').get_group('충남')
len(df.groupby('시도').get_group('충남'))
#94개가 있음

MultiIndex: 인덱스를 계층적으로 만들 수 있다. 

반응형