Snoopy [Python] Pandas - 4. 데이터프레임 기본개념, 생성, 인덱싱과 슬라이싱(출력)
Python/Pandas

[Python] Pandas - 4. 데이터프레임 기본개념, 생성, 인덱싱과 슬라이싱(출력)

Sooyoon Jeong 2022. 10. 26.

[공식문서]

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html

 

1. 데이터프레임이란?

1) 2차원 배열로, 행과 열로 구성되어 있다.

2) 각 열은 각각의 데이터 타입(dtype)을 가진다.

 

2. 데이터프레임 생성하기

pd.DataFrame( [  ] )을 사용해서 데이터프레임을 생성할 수 있다.

1) 리스트를 통해 생성(2차원 리스트를 대입)

생성 시 columns를 지정하면 각 열에 대한 컬럼명을 지정할 수 있다.

pd.DataFrame([[1, 2, 3], 
              [4, 5, 6], 
              [7, 8, 9]], columns = ['컬럼1', '컬럼2', '컬럼3'])

  2) 딕셔너리를 통해 생성

딕셔너리의 key값이 자동으로 컬럼명으로 지정된다.

3. 인덱싱과 슬라이싱 

1) 1개의 컬럼을 가져올 수 있고 1개의 컬럼 선택 시 시리즈가 출력된다.

 

2) 2개 이상의 컬럼 선택 시 fancy indexing으로 가능하다. (데이터 프레임으로 출력된다.)

댓글