이번에는 데이터프레임을 엑셀로 저장/읽는 방법에 대해서 알아보겠습니다.
CSV 파일로 저장하기
df
---------------------------------------------------
종목명 현재가 등락률
종목코드
037730 3R 1510 7.36
036360 3SOFT 1790 1.65
005760 ACTS 1185 1.28
df.to_csv("data.csv")
엑셀로 저장하기
df.to_excel("data.xlsx")
# 시트 이름을 설정
df.to_excel("data2.xlsx", sheet_name="종목정보")
# 인덱스 제거
df.to_excel("data3.xlsx", index=False)
# 컬럼 제거
df.to_excel("data4.xlsx", header=False)
엑셀 파일 불러오기
import pandas as pd
df = pd.read_excel("code.xlsx")
df.head()
# 특정 컬럼을 인덱스로 지정 가능
df = pd.read_excel("code.xlsx", index_col='cd')
df.head()
# 컬럼 인덱스는 0 부터 시작하기때문에 컬럼1은 컬럼 "cd" 를 인덱스로 설정하는 것과 동일한 의미이다
df = pd.read_excel("code.xlsx", index_col=1)
df.head()
# "Unnamed: 0" 컬럼을 제거하고 싶다면 인덱스를 1부터 시작하면 된다
df = pd.read_excel("code.xlsx", index_col='cd', usecols=[1, 2, 3])
df.head()
# 엑셀파일에 필요하지 않은 데이터가 포함된경우, header 옵션으로 제거할 수 있다
df = pd.read_excel("code2.xlsx", header=2, index_col='cd', usecols=[1, 2, 3])
df.head()
가끔 엑셀파일/CSV파일을 읽을때, 0 으로 시작하는 숫자가 지워지는 경우가 있다.
이럴때는 데이터 타입을 스트링 타입으로 변경하면 된다.
df = pd.read_csv("magic.csv", dtype={'code': str})
df
'Python > Data analysis' 카테고리의 다른 글
[Python] Data Analysis - DataFrame - Melt (0) | 2023.04.08 |
---|---|
[Python] Data Analysis - DataFrame - Pivot (0) | 2023.04.08 |
[Python] Data Analysis - DataFrame - Stack / Unstack (0) | 2023.04.07 |
[Python] Data Analysis - DataFrame - multi-column (0) | 2023.04.07 |
[Python] Data Analysis - DataFrame - multi-index (0) | 2023.04.06 |