파이썬 판다스 라이브러리 활용하여 엑셀 데이터를 다루어 볼까요?
엑셀은 참으로 편한 소프트웨어 입니다. 파이썬 이에 질쎄라 엑셀을 다룰수 있는 라이브러리를 만들어 두었습니다. 그 중에서 판다스는 가장 다루기 편하고 활용하기 좋은 라이브러리 입니다.
1. 파이썬 판다스 엑셀 다루기 개요
파이썬 판다스 라이브러리 중에서 엑셀을 다루는 부분입니다.
1) 판다스(Pandas) 라이브러리 설치하기
판다스 라이브러리를 설치해야 한다. 방법은 아래와 같다.
C:\>pip install pandas
라이브러리를 설치했으니 본격적인 코드를 알아보겠습니다.
2. read_excel()의 지정 가능한 옵션
판다스 라이브러리를 활용하여 엑셀파일을 읽어올 때 사용하는 함수는 read_excel() 이다.
여기에는 다양한 옵션이 있다. 그것을 알아보겠다.
1) 판다스 라이브러리로 엑셀 파일 읽어오기
기본 코드는 아래와 같습니다.
# 라이브러리 import
import pandas as pd
# 엑셀 지정
filename = 'testexcel.xlsx'
# 엑셀 파일 읽기
df = pd.read_excel(filename, engine='openpyxl')
print(df)
위와 같이 판다스 라이브러리에 있는 함수 read_excel()을 활용하여 엑셀 파일을 읽어옵니다.
엑셀 데이터는 데이터프레임 구조로 df 변수에 저장이 됩니다.
여기서는 필수 항목인 filename 과 옵션인 engine 만을 사용했습니다.
그 외 많은 옵션이 있는데, 알아 볼겠습니다.
2) read_excel() 의 옵션
read_excel 의 문법 옵션은 아래와 같습니다.
read_excel(filename,
sheet_name = '서울',
header = None,
names = ['일시','평균','최저','최고'],
index_col = None,
usecols = "C:F",
dtype = {'일시':str, '평균':float, '최저':float, '최고':float},
skiprows = 32,
nrows = 28,
na_values = 'nan',
thousands = ',')
각 옵션의 설명입니다.
- sheet_name:
- 기본값 0 입니다.
- 시트의 인덱스 번호(int) 또는 시트의 이름(문자열)이 들어갑니다.
- 리스트 값을 넣을 수 있습니다.
- None 설정 시 모든 시트를 선택합니다.
- header:
- 어느 행(row)에 열(column)의 이름이 있는지 지정합니다.
- 기본 값은 0으로 첫 번째 줄을 헤더로 인식합니다.
- None 설정 시 헤더가 없는 것으로 설정되어 첫 번째 줄부터 바로 데이터로 읽어드립니다.
- names:
- 위 header가 None일 경우 열(column)의 이름을 지정합니다.
- header가 없으니, 여기서 지정해 주는 것이죠.
- index_col:
- 각 행(row)의 이름이 위치한 열(column)을 지정합니다.
- 기본값은 None 입니다.
- usecols:
- 기본값은 None으로 모든 열을 다 불러옵니다.
- “A:C”, “B,D,F,G,I,Z", "A,C,E:H” 와 같이 원하는 열을 선택해서 불러올 수 있습니다.
- dtype:
- 각 열의 데이터 타입을 지정합니다.
- skiprows:
- 엑셀을 읽을 때 첫줄(0)으로 부터 몇 줄을 건너뛸 지 지정합니다.
- nrow:
- 몇 줄을 읽을 지 지정합니다.
- na_values:
- 값이 없는 경우 어떤 str 등으로 넣을 지 지정합니다.
- thousands:
- 돈과 같이 천단위로 쉼표(,)로 구분된 문자를 변환하기 위해 천단위의 구분자가 무엇인지 지정합니다.
3. 정리하며
파이썬의 판다스의 용도중의 하나는 엑셀입니다.
엑셀의 기능을 코딩으로 처리할 수 있습니다. 어쩌면 보다더 효율적인 작업이 가능합니다.
사무업무의 자동화에 엑셀의 기능을 많이 활용하죠
여기에 프로그램밍을 더하면 효율적인 업무 자동화가 되리라 보입니다.
read_excel() 활용 연습을 해 보시면 기능을 익히시기 바랍니다.
[같이 보기]
- 비행기 반입 금지 물품 - 휴대용 라이터, 호신용 스프레이 는
- 대한항공 기내 면세품 KAL기내 면세품 - 구매, 사전주문 알아보기
- 해외 여행 준비 필수 준비물 - 필수템, 꼭 챙겨야 하는 것들
- 아시아나 마일리지 가족회원 등록하기 - 항공마일리지 모으기, 아시아나 마일리지 적립 방법, 가족 간 사용 공유
- 대한항공 마일리지 - 비행기표 예매, 마일리지 확인하기
- 해외 여행의 필수품 재외공관 - 외교부 재외공관, 해외여행 안전지도 알아두기
'파이썬 데이터분석' 카테고리의 다른 글
파이썬 'str' object is not callable 에러 발생 (0) | 2024.06.12 |
---|---|
A JNI error has occurred, please check your installation and try again (1) | 2024.05.15 |
Another java installation is in progress you must complete that installation before (0) | 2024.05.15 |
테이블스페이스 지정하여 테이블 생성 하기 - 인덱스도 지정 (0) | 2024.05.09 |
데이터 처리 방식 OLTP OLAP 알아보기 (1) | 2024.04.28 |