본문 바로가기

Python/Data analysis

(15)
[Python] Data Analysis - DataFrame - add data 이번 시간에는 기존 데이터프레임에 데이터를 추가하는 방법에 대해서 알아보겠습니다. 먼저 횡방향(컬럼 데이터 추가) 데이터 추가하는 샘플입니다. from pandas import DataFrame import pandas as pd data = { '종가': [113000, 111500], '거래량': [555850, 282163] } index = ["2019-06-21", "2019-06-20"] df1 = DataFrame(data=data, index=index) df1 ------------------------------------------- 종가거래량 2019-06-21113000555850 2019-06-20111500282163 data = { '시가': [112500, 110000], ..
[Python] Data Analysis - DataFrame - groupby groupby 함수는 다양한 옵션 및 기능이 있지만 여기서는 기본적인 기능에 대해서만 알아보겠습니다. df ---------------------------------------------- 테마종목명PERPBR 02차전지(생산)SK이노베이션10.191.29 1해운팬오션21.230.95 2시스템반도체티엘아이35.971.12 3해운HMM21.523.20 4시스템반도체아이에이37.323.55 52차전지(생산)LG화학83.063.75 df1 = df[df["테마"] == "2차전지(생산)"] df2 = df[df["테마"] == "해운"] df3 = df[df["테마"] == "시스템반도체"] df1 ---------------------------------------------- 테마종목명PERPBR 02..
[Python] Data Analysis - DataFrame - sort, rank sort df ----------------------------------------- 종목명현재가 종목코드 0377303R1510 0363603SOFT1790 005670ACTS1185 df.sort_values("현재가") ----------------------------------------- 종목명현재가 종목코드 005670ACTS1185 0377303R1510 0363603SOFT1790 df.sort_values(by="현재가") ----------------------------------------- 종목명현재가 종목코드 005670ACTS1185 0377303R1510 0363603SOFT1790 df.sort_values(by="현재가", ascending=False) -------..
[Python] Data Analysis - DataFrame - Filter 이번 시간에는 DataFrame 의 Filter 에 대해서 알아보겠습니다. df ------------------------------------------- 2018/122019/122020/122021/12(E) DPS1416.001416.002994.001755.00 PER6.4217.6321.0913.93 PBR1.101.492.061.88 df.filter(items=["2018/12"]) ------------------------------------------- 2018/12 DPS1416.00 PER6.42 PBR1.10 df.filter(items=["PER"], axis=0) ------------------------------------------- 2018/122019/12202..
[Python] Data Analysis - DataFrame - Query 이번 시간에는 DataFrame 의 Query 에 대해서 알아보겠습니다. df ---------------------------- nmopenclose cd A0603103S29202800 A095570AJ네트웍스19201900 A006840AK홀딩스20202010 A054620APS홀딩스31203200 cond = df['open'] >= 2000 df[cond] ---------------------------- nmopenclose cd A0603103S29202800 A006840AK홀딩스20202010 A054620APS홀딩스31203200 상기 내용을 Query 로 표현 하면 아래와 같습니다. df.query("open>=2000") ---------------------------------..
[Python] Data Analysis - DataFrame 데이터 프레임을 만드는 3가지 방법 1. 딕셔너리로 데이터 프레임 생성. 2. 리스트로 데이터 프레임 생성 3. 리스트와 딕셔너리로 데이터 프로임 생성 from pandas import DataFrame data = { '종목코드': ["037730", "036360", "005670"], '종목명': ["3R", "3SOFT", "ACTS"], '현제가': [1510, 1790, 1185] } df = DataFrame(data) df ----------------------------------- 종목코드종목명현제가 00377303R1510 10363603SOFT1790 2005670ACTS1185 from pandas import DataFrame data = [ ["037730", "3R", 15..
[Python] Data Analysis - Series 데이터 분석중에 시리즈에 대해서 간략히 정리해 보겠습니다. 참고도서 [금융 데이터 분석을 위한 파이썬 판다스] 인덱스 추출 # 인덱스 추출 data = [1000, 2000, 3000] s = Series(data) print(s.index) print(s.index.to_list()) ------------------------------ RangeIndex(start=0, stop=3, step=1) [0, 1, 2] 인덱스 변경 from pandas import Series import numpy as np # 인덱스 변경 data = [1000, 2000, 3000] s = Series(data) print(s.index) print(s.index.to_list()) print(s) print()..