본문 바로가기

Python/Data analysis

[Python] Data Analysis - DataFrame - excel

이번에는 데이터프레임을 엑셀로 저장/읽는 방법에 대해서 알아보겠습니다.

 

 

CSV 파일로 저장하기

 

df
---------------------------------------------------
	종목명	현재가	등락률
종목코드			
037730	3R	1510	7.36
036360	3SOFT	1790	1.65
005760	ACTS	1185	1.28
df.to_csv("data.csv")

 

 

 

엑셀로 저장하기

 

 

 

df.to_excel("data.xlsx")

 

 

 

# 시트 이름을 설정
df.to_excel("data2.xlsx", sheet_name="종목정보")

 

 

# 인덱스 제거
df.to_excel("data3.xlsx", index=False)

 

 

# 컬럼 제거
df.to_excel("data4.xlsx", header=False)

 

 

 

엑셀 파일 불러오기

 

import pandas as pd

df = pd.read_excel("code.xlsx")
df.head()

 

 

 

# 특정 컬럼을 인덱스로 지정 가능
df = pd.read_excel("code.xlsx", index_col='cd')
df.head()

 

 

 

# 컬럼 인덱스는 0 부터 시작하기때문에 컬럼1은 컬럼 "cd" 를 인덱스로 설정하는 것과 동일한 의미이다
df = pd.read_excel("code.xlsx", index_col=1)
df.head()

 

 

 

# "Unnamed: 0" 컬럼을 제거하고 싶다면 인덱스를 1부터 시작하면 된다
df = pd.read_excel("code.xlsx", index_col='cd', usecols=[1, 2, 3])
df.head()

 

 

 

# 엑셀파일에 필요하지 않은 데이터가 포함된경우, header 옵션으로 제거할 수 있다
df = pd.read_excel("code2.xlsx", header=2, index_col='cd', usecols=[1, 2, 3])
df.head()

 

 

 

가끔 엑셀파일/CSV파일을 읽을때, 0 으로 시작하는 숫자가 지워지는 경우가 있다.

이럴때는 데이터 타입을 스트링 타입으로 변경하면 된다.

 

df = pd.read_csv("magic.csv", dtype={'code': str})
df