Pandas 튜토리얼에 있는 Lessons for new pandas users_04에 대한 내용이다.
본 장에서는 새로운 열(columns)을 추가, 삭제하고, 데이터를 슬라이싱(slicing)하는 여러 가지 방법을 다룬다.
# 라이브러리 임포트하기
import pandas as pd
# 데이터셋 만들기
d = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
# 데이터프레임 만들기
df = pd.DataFrame(d)
df
# 열(column)의 이름 변경하기
df.columns = ['Rev']
df
# 열(column) 추가하기
df['NewCol'] = 5
df
# 새로 만든 열(column) 수정하기
df['NewCol'] = df['NewCol'] + 1
df
# 열(column) 삭제하기
del df['NewCol']
df
# 두 개의 열(column) 추가하기
df['test'] = 3
df['col'] = df['Rev']
df
# 인덱스(index)의 이름 변경하기
i = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
df.index = i
df
loc
을 이용하여 데이터프레임의 일부를 선택할 수 있다.
df.loc['a']
# df.loc[inclusive:inclusive]
df.loc['a':'d']
# df.iloc[inclusive:exclusive]
df.iloc[0:3]
iloc
은 loc
와 달리 순서를 나타내는 정수형(integer) 인덱스만 받는다.
열(column) 이름을 사용하여 열을 선택할 수 있다.
df['Rev']
df[['Rev', 'test']]
# df.ix[row, columns]
# ix 함수 대체하기
# df.ix[0:3, 'Rev']
df.loc[df.index[0:3], 'Rev']
# ix 함수 대체하기
# df.ix[5:, 'col']
df.loc[df.index[5:], 'col']
# ix 함수 대체하기
# df.ix[:3, ['col', 'test']]
df.loc[df.index[:3], ['col', 'test']]
데이터프레임의 처음 또는 끝에 있는 관측치(observation)를 확인하려면 다음과 같이 하면 된다.
df.head()
df.tail()