π«μ¬νκ΄μ§ν λΆμ 02-λ°μ΄ν° μκ°
π¨ μ°λ¦¬ νμ΄ μ§νν νλ‘μ νΈλ Cardio-Vascular Disease Prediction μΌλ‘, μ¬νκ΄ μ§νμ μμΈ‘νλ λͺ¨λΈμ λ§λλ κ²μ΄ νλ‘μ νΈμ λͺ©μ μ΄λ€.
π¨ μ΄ νλ‘μ νΈλ₯Ό μν΄ μΊκΈμμ ν΄λΉ λ°μ΄ν°λ₯Ό κ°μ ΈμμΌλ©°, λ§ν¬λ λ°λ‘ μλμ 첨λΆν΄ λμλ€.
π¨ μ΄λ² ν¬μ€ν
μμλ κΈ°λ³Έμ μΌλ‘ λ°μ΄ν°λ₯Ό μ€λͺ
ν κ²μ΄λ€.
Attributes
π¨ λ°μ΄ν°λ₯Ό λΆλ¬μ€κ³ νλ‘μ νΈ μ§νμ μν΄ μλμ κ°μ λΌμ΄λΈλ¬λ¦¬λ€μ 미리 μν¬νΈνλ€. λ°μ΄ν° μ μ²λ¦¬ κ³Όμ μλ μλμ μ½λλ§ μμΌλ©΄ λκ³ , νλ‘μ νΈλ₯Ό μ§ννλ©΄μ μΆκ°μ μΈ λΌμ΄λΈλ¬λ¦¬λ€μ μν¬νΈν κ²μ΄λ€.
# λ°μ΄ν° μν¬νΈ, μ μ²λ¦¬λ₯Ό μν pandas, numpy library μν¬νΈ
import pandas as pd
import numpy as np
# μκ°νλ₯Ό μν plotly library μν¬νΈ
import plotly.graph_objects as go
import plotly.offline as pyo
pyo.init_notebook_mode()
π¨ λ¨Όμ λ°μ΄ν°λ₯Ό λΆλ¬μ보λλ‘ νμ.
cardio = pd.read_csv('C:\\Users\mingu\Desktop\\cardio_train.csv', sep=';')
cardio
π¨ μ°¨ν μ§νμ μν΄ μ΄λ¦μ cardio λΌκ³ λΆμκ³ , μΌλ°μ μΈ CSV νμΌμ μ½€λ§(,) λ‘ κ΅¬λΆμ΄ λκΈ°μ pd.read_csv() λ§μ μ¬μ©νμ¬ λΆλ¬μ¬ μ μμ§λ§ λ΄κ° μ¬μ©ν λ°μ΄ν°λ μΈλ―Έμ½λ‘ (;) μΌλ‘ ꡬλΆλμ΄ μμκΈ° λλ¬Έμ sep=β;β μ΅μ
μ λ£μ΄ λ°μ΄ν°λ₯Ό λΆλ¬μλ€.
π¨ κ° attributeκ° λ¬΄μμ μλ―Ένλμ§ μ΄ν΄λ³΄μ.
- λμ΄
- μ±λ³(1-women, 2-men)
- ν€(cm)
- λͺΈλ¬΄κ²(kg)
- ap_hi(systolic blood pressure, μμΆνμ)
- ap_lo(diastolic blood pressure, μ΄μνμ)
- cholesterol(1-normal, 2-above normal, 3-well above normal)
- gluc(νλΉ)(1-normal, 2-above normal, 3-well above normal)
- smoke(0-λΉν‘μ°, 1-ν‘μ°)
- alco(0-μμ£ΌX, 1-μμ£ΌO)
- active(μ΄λμ¬λΆ)(0-X, 1-O)
- Cardio(target)(0-X, 1-O)
π¨ λΆκ°μ μΈ μ μ²λ¦¬κ° νμνκ² μ§λ§, κ²°λ‘ μ μΌλ‘λ μμ 11κ°μ attributeλ₯Ό κ°μ§κ³ λ§μ§λ§ Cardio attribute λ₯Ό μμΈ‘νλ κ²μ΄ μ΅μ’
μ μΈ νλ‘μ νΈμ λͺ©νμ΄λ€.
π¨ μ μ²λ¦¬μ λν΄μλ λ€μ μ λ‘λμμ λ€λ£° μμ μ΄λ€.
Leave a comment