본문 바로가기
파이썬 데이터분석

파이썬 판다스 - 엑셀 사용 옵션 - pandas.read_excel()

by 데이터스토리 2024. 6. 6.
반응형

파이썬 판다스 라이브러리 활용하여 엑셀 데이터를 다루어 볼까요? 

엑셀은 참으로 편한 소프트웨어 입니다. 파이썬 이에 질쎄라 엑셀을 다룰수 있는 라이브러리를 만들어 두었습니다. 그 중에서 판다스는 가장 다루기 편하고 활용하기 좋은 라이브러리 입니다.

 

파이썬 판다스 - 엑셀 사용 옵션
파이썬 판다스 - 엑셀 사용 옵션

 

 

1. 파이썬 판다스 엑셀 다루기 개요

 

파이썬 판다스 라이브러리 중에서 엑셀을 다루는 부분입니다.

 

1) 판다스(Pandas) 라이브러리 설치하기

 

판다스 라이브러리를 설치해야 한다.  방법은 아래와 같다.

 

C:\>pip install pandas

 

 

라이브러리를 설치했으니 본격적인 코드를 알아보겠습니다.

 

 

 

 

 

 

 

 

 

pandas documentation
pandas documentation

 

 

 

 

 

 

 

2. read_excel()의 지정 가능한 옵션 

 

 판다스 라이브러리를 활용하여 엑셀파일을 읽어올 때 사용하는 함수는 read_excel() 이다.

여기에는 다양한 옵션이 있다. 그것을 알아보겠다.

 

 

1) 판다스 라이브러리로 엑셀 파일 읽어오기

 

 

 

 

 

 

 

 

 

 

 

기본 코드는 아래와 같습니다.

# 라이브러리 import
import pandas as pd

# 엑셀 지정
filename = 'testexcel.xlsx'

# 엑셀 파일 읽기
df = pd.read_excel(filename, engine='openpyxl')

print(df)

 

위와 같이 판다스 라이브러리에 있는 함수 read_excel()을 활용하여 엑셀 파일을 읽어옵니다.

엑셀 데이터는 데이터프레임 구조로 df 변수에 저장이 됩니다.

 

여기서는 필수 항목인 filename 과 옵션인 engine 만을 사용했습니다.

그 외 많은 옵션이 있는데, 알아 볼겠습니다.

 

 

2) read_excel() 의 옵션

 

 

 

 

 

 

 

 

read_excel 의 문법 옵션은 아래와 같습니다.

read_excel(filename,
	sheet_name = '서울',
	header = None,
	names = ['일시','평균','최저','최고'],
	index_col = None, 
	usecols = "C:F",
	dtype = {'일시':str, '평균':float, '최저':float, '최고':float},
	skiprows = 32,
	nrows = 28,
	na_values = 'nan',
	thousands = ',')

 

각 옵션의 설명입니다.

 

  • sheet_name
    • 기본값 0 입니다.
    • 시트의 인덱스 번호(int) 또는 시트의 이름(문자열)이 들어갑니다.
    • 리스트 값을 넣을 수 있습니다.
    • None 설정 시 모든 시트를 선택합니다.
  • header:
    • 어느 행(row)에 열(column)의 이름이 있는지 지정합니다.
    • 기본 값은 0으로 첫 번째 줄을 헤더로 인식합니다.
    • None 설정 시 헤더가 없는 것으로 설정되어 첫 번째 줄부터 바로 데이터로 읽어드립니다.
  • names
    • 위 header가 None일 경우 열(column)의 이름을 지정합니다.
    • header가 없으니, 여기서 지정해 주는 것이죠.
  • index_col
    • 각 행(row)의 이름이 위치한 열(column)을 지정합니다.
    • 기본값은 None 입니다.
  • usecols
    • 기본값은 None으로 모든 열을 다 불러옵니다.
    • “A:C”, “B,D,F,G,I,Z", "A,C,E:H” 와 같이 원하는 열을 선택해서 불러올 수 있습니다.
  • dtype
    • 각 열의 데이터 타입을 지정합니다.
  • skiprows
    • 엑셀을 읽을 때 첫줄(0)으로 부터 몇 줄을 건너뛸 지 지정합니다.
  • nrow
    • 몇 줄을 읽을 지 지정합니다.
  • na_values
    • 값이 없는 경우 어떤 str 등으로 넣을 지 지정합니다.
  • thousands
    • 돈과 같이 천단위로 쉼표(,)로 구분된 문자를 변환하기 위해 천단위의 구분자가 무엇인지 지정합니다.

 

 

pandas.read_excel
pandas.read_excel

 

 

 

 

 

 

 

3. 정리하며

 

파이썬의 판다스의 용도중의 하나는 엑셀입니다.

엑셀의 기능을 코딩으로 처리할 수 있습니다. 어쩌면 보다더 효율적인 작업이 가능합니다.

 

사무업무의 자동화에 엑셀의 기능을 많이 활용하죠

여기에 프로그램밍을 더하면 효율적인 업무 자동화가 되리라 보입니다.

 

read_excel()  활용 연습을 해 보시면 기능을 익히시기 바랍니다.

 


[같이 보기]

 

  • 비행기 반입 금지 물품 - 휴대용 라이터, 호신용 스프레이 는
 

비행기 반입 금지 물품 - 휴대용 라이터, 호신용 스프레이 는

비행기 반입 금지 물품 내용입니다. 2014년 1월 1일부터 적용되는 내용입니다. 국토교통부 교통안전공단, 대한항공 3개 기관이 합동으로 작성한 자료입니다. pdf 내용을 옮기며, 일반적인 물품은

twdatastory.tistory.com

 

 

  • 대한항공 기내 면세품 KAL기내 면세품 - 구매, 사전주문 알아보기
 

대한항공 기내 면세품 KAL기내 면세품 - 구매, 사전주문 알아보기

대한항공 기내 면세품 구매 사전주문 관련하여 알아보겠습니다. 아래 내용 참조하시어 해외여행에 도움 되기 바랍니다. 또한 대한항공 기내에서 면세품을 구매하는 방법도 활용해 보시기 바랍

twdatastory.tistory.com

 

  • 해외 여행 준비 필수 준비물 - 필수템, 꼭 챙겨야 하는 것들
 

해외 여행 준비 필수 준비물 - 필수템, 꼭 챙겨야 하는 것들

해외 여행 준비 필수 준비물 - 필수템, 꼭 챙겨야 하는 것들에 대해서 알아보겠습니다. 해외 여행은 미리 준비하면 여러면에서 유리 합니다. 그리고 여행의 즐거움은 필요한 물건이 가방에 있는

twdatastory.tistory.com

 

  • 아시아나 마일리지 가족회원 등록하기 - 항공마일리지 모으기, 아시아나 마일리지 적립 방법, 가족 간 사용 공유
 

아시아나 마일리지 가족회원 등록하기 - 항공마일리지 모으기, 아시아나 마일리지 적립 방법,

가족이랑 마일리지로 제주도에 가고자 한다. 아직 나에게는 아시아나 마일리지가 70,000마일이 남아있다. 2명을 등록하고 마일리로 계산하려 했다. 안된다고 한다. 가족회원에 아내가 없어서 이

twdatastory.tistory.com

 

  • 대한항공 마일리지 - 비행기표 예매, 마일리지 확인하기
 

대한항공 마일리지 - 비행기표 예매, 마일리지 확인하기

대한항공 마일리지 항공권 구입 - 누적된 대한항공 마일리지를 사용해서 비행기표 예매 방법을 알아보겠습니다. 비행기표 예매 시 마일리지 사용법이니 잘 따라와 주세요. 1. 대한항공 마일리지

twdatastory.tistory.com

 

  • 해외 여행의 필수품 재외공관 - 외교부 재외공관, 해외여행 안전지도 알아두기
 

해외 여행의 필수품 재외공관 - 외교부 재외공관, 해외여행 안전지도 알아두기

해외여행의 필수품 재외공관 그 재외공관에 대해서 알아보겠습니다. 외교부가 운영 중으로 해외 거주자 또는 해외 여행 하는 분들을 위한 우리나라 지역이죠 1. 해외 여행의 필수품 재외공관 -

twdatastory.tistory.com

 

 

반응형