데이터 분석을 하면 찾는게 파이썬이다. 사용하는 라이브러리는 판다스(Pandas)이다. 판다스에는 데이터프레임이라는 구조체가 있다. 엑셀과 같이 행과 열을 가지는 구조다, 데이터분석에는 데이터프레임 만 한게 없다.
이런 데이터프레임을 출력할 때 한번에 한개만 가능하다. 그런데 display() 함수를 사용하면 여러개를 한번에 출력할 수 있다.
확인해 보자
1. 데이터프레임 만들기
데이터프레임을 위한 판다스 라이브러리를 Import 하자
# 판다스 라이브러리 import - 데이터프레임 사용을 위함
import pandas as pd
엑셀 데이터를 읽어 들여서 데이터프레임이 넣는다. 데이터프레임이 만들어진다. 여기서 사용하는 데이터는 오피넷에서 추출한 과거 주유소 유류 데이터이다.
# 데이터프레임에 엑셀 데이터를 읽어 들이기
# 오피넷에서 과거 데이터를 추출하여 엑셀에 담아 두었다.
# 그 엑셀 데이터를 읽어 드린다.
oil_price_df = pd.read_excel(r"data/과거_판매가격_202309.xlsx", engine = "openpyxl")
데이터프레임 "all_price_df"를 만들었다.
2. 데이터프레임 을 여러개 적어서 출력해 보면
아래와 같이 하면 head() 부분의 데이터는 안 나오고 tail() 부분의 데이터가 나온다. df를 바로하면 마지막 내용만 보여준다.
그런데 우리는 둘 다 같이 나왔으면 한다.
# df의 데이터 확인
oil_price_df.head(3)
oil_price_df.tail(3)
3. 데이터프레임 여러개 한번에 출력하기
파이썬에 display() 함수가 있다. 이것에 적어둔 여러개의 데이터프레임 전체를 출력한다. display의 괄호안에 넣은 것 전부 출력한다. 단, 각 항목별 이어서 출력되지 않고 다음줄에 출력된다. print()와는 다르다,
# DF의 데이터 점검: 데이터 확인 head(), tail()
display(oil_price_df.head())
display(oil_price_df.tail())
display(oil_price_df.head(3))
display(oil_price_df.tail(3))
위 문장은 아래와 같이 해도 같은 결과가 나온다.
display(oil_price_df.head(3), oil_price_df.tail(3))
display() 함수를 사용해서 데이터프레임 여러개를 한 번에 출력하세요, 데이터를 확인하는 데 용이합니다. print() 함수과 차이가 있으니, 상황에 따라 적용하시기 바랍니다. 아마, 섞어서 쓰는 게 어떨까 싶네요.