๐๋ฐ์ด์ฝ KOSPI ๋ถ์ 02-๋ฐ์ดํฐํ์ธ
๐ 1. ๋ฐ์ดํฐ ๋ถ๋ฌ์ค๊ธฐ
๐ ๋ฐ์ดํฐ๋ ๋ฐ์ด์ฝ์์ ๋ฐฐํฌํ ์ฝ๋๋ฅผ ๋ฐํ์ผ๋ก 2022-09-13 ๊น์ง์ ์ฝ์คํผ ์ง์๋ฅผ ์ถ์ถํ์์ต๋๋ค.
๐ ๋ฐ์ดํฐ ์ค๋ช
Close
: ์ข ๊ฐOpen
: ์๊ฐHigh
: ๊ณ ๊ฐLow
: ์ ๊ฐVolume
: ๊ฑฐ๋๋Change
: ๋ฑ๋ฝ๋ฅ (์ ์ผ๋๋น ๋ฑ๋ฝ๋ฅ ) -> ๋ฑ๋ฝ๋ฅ = (ํ์ฌ ์ข ๊ฐ - ์ ์ผ ์ข ๊ฐ) / ์ ์ผ์ข ๊ฐ
๐ ๋ฐ์ดํฐ ํ์ธ
# ์ฝ๋ ์งํ ์ค ๋ถํ์ํ๊ฒ ์ถ๋ ฅ๋๋ warning ๋ฌด์ ์ฝ๋
import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import numpy as np
# ์๊ณ์ด ์ฒ๋ฆฌ๋ฅผ ์ํ datetime ์ํฌํธ
from datetime import datetime
# ์๊ฐํ๋ฅผ ์ํ seaborn, matplotlib ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ํฌํธ
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
# ์๊ฐํ๋ฅผ ์ํ plotly library ์ํฌํธ
import plotly.graph_objects as go
import plotly.offline as pyo
pd.options.plotting.backend = 'plotly'
import plotly.io as pio
pio.renderers.default = "notebook_connected"
kospi = pd.read_csv('kospi_data.csv')
kospi
2. ๐ KOSPI ๋ฐ์ดํฐ ํ์ธ
- ๊ฒฐ์ธก์น ์กด์ฌ์ฌ๋ถ ํ์ธ
- Outlier ์กด์ฌ์ฌ๋ถ ํ์ธ
- ์ค๋ณต ๋ ์ง ์กด์ฌ์ฌ๋ถ ํ์ธ
2.1. ๊ฒฐ์ธก์น ์กด์ฌ์ฌ๋ถ ํ์ธ
kospi.isnull().sum()
>> Out[26]
Date 0
Close 0
Open 0
High 0
Low 0
Volume 0
Change 0
dtype: int64
๐ ๊ฒฐ์ธก์น๋ ์กด์ฌํ์ง ์์์ ํ์ธํ์์ต๋๋ค.
2.2. Outlier ์กด์ฌ์ฌ๋ถ ํ์ธ
# boxplot์ ์ฌ์ฉํ outlier ๊ฒ์ฆ
fig = go.Figure()
fig.add_trace(go.Box(x = kospi['Close'], name = 'Close'))
fig.add_trace(go.Box(x = kospi['Open'], name = 'Open'))
fig.add_trace(go.Box(x = kospi['High'], name = 'High'))
fig.add_trace(go.Box(x = kospi['Low'], name = 'Low'))
fig.show()
# Change attribute ํ์ธ - ์ด์์์
fig = go.Figure()
fig.add_trace(go.Box(x = kospi['Change'], name = 'Change'))
fig.show()
# Volume attribute ํ์ธ - max ๊ฐ ์์ฌ์ค๋ฌ์
fig = go.Figure()
fig.add_trace(go.Box(x = kospi['Volume'], name = 'Volume'))
fig.show()
๐ Outlier ํ์ธ ์ค์ Volume attribute์ ๋ํด์ max๊ฐ์ด ์ง๋์น๊ฒ ํฌ๋ค๋ ์๊ฐ์ด ๋ค์ด ํ์ธํด ๋ณด์์ต๋๋ค. ๋ค์ด๋ฒ๊ธ์ต์์ ํ์ธํ ๊ฒฐ๊ณผ ์ด์์๋ ๋ฐ์ดํฐ๋ก ๋์์ผ๋ฉฐ, ์ธ์ ํ ๋ ๋ค๊ณผ ๋น๊ตํ์ฌ ์ ์ผํ๊ฒ ์์น์ธ๋ฅผ ๋ณด์ธ ์ฅ์ด์๊ธฐ ๋๋ฌธ์ ์ด์ ๊ฐ์ด ๋์ ๊ฑฐ๋๋์ ๋ณด์ธ ๊ฒ์ด ์๋๊น ์๊ฐํฉ๋๋ค.
kospi[kospi['Volume']==kospi['Volume'].max()]
>> Out[30]
Date Close Open High Low Volume Change
------------------------------------------------------------------------
10644 2021-02-19 3107.62 3089.96 3109.67 3040.28 3.460000e+09 0.0068
๐ ๋ฐ์ดํฐ ํ์ธ ๊ฒฐ๊ณผ ๊ฒฐ์ธก์น๋ ์ด์์น ๋ฑ์ ๋ฌธ์ ๋ ์กด์ฌํ์ง ์์์ต๋๋ค. ๋ฐ๋ผ์ ๋ณธ ๋ฐ์ดํฐ์์ ๋ณ๋์ ์ ์ฒ๋ฆฌ ์์ด ๋ถ์ํ๊ธฐ๋ก ๊ฒฐ์ ํ์์ต๋๋ค.
๐ ๋ค์ ํฌ์คํ ์์๋ ์ด๋ํ๊ท ์ ์ ์ฌ์ฉํ์ฌ KOSPI๋ฅผ ๋ถ์ํ ๊ฒ์ ๋๋ค!!
Leave a comment