🚨 우리 νŒ€μ΄ μ§„ν–‰ν•œ ν”„λ‘œμ νŠΈλŠ” Cardio-Vascular Disease Prediction 으둜, μ‹¬ν˜ˆκ΄€ μ§ˆν™˜μ„ μ˜ˆμΈ‘ν•˜λŠ” λͺ¨λΈμ„ λ§Œλ“œλŠ” 것이 ν”„λ‘œμ νŠΈμ˜ λͺ©μ μ΄λ‹€.

🚨 이 ν”„λ‘œμ νŠΈλ₯Ό μœ„ν•΄ μΊκΈ€μ—μ„œ ν•΄λ‹Ή 데이터λ₯Ό κ°€μ Έμ™”μœΌλ©°, λ§ν¬λŠ” λ°”λ‘œ μ•„λž˜μ— 첨뢀해 λ‘μ—ˆλ‹€.

πŸ“ Cardio Vascular Data

🚨 이번 ν¬μŠ€νŒ…μ—μ„œλŠ” 기본적으둜 데이터λ₯Ό μ„€λͺ…ν•  것이닀.

Attributes

🚨 데이터λ₯Ό 뢈러였고 ν”„λ‘œμ νŠΈ 진행을 μœ„ν•΄ μ•„λž˜μ™€ 같은 λΌμ΄λΈŒλŸ¬λ¦¬λ“€μ„ 미리 μž„ν¬νŠΈν–ˆλ‹€. 데이터 μ „μ²˜λ¦¬ κ³Όμ •μ—λŠ” μ•„λž˜μ˜ μ½”λ“œλ§Œ 있으면 되고, ν”„λ‘œμ νŠΈλ₯Ό μ§„ν–‰ν•˜λ©΄μ„œ 좔가적인 λΌμ΄λΈŒλŸ¬λ¦¬λ“€μ„ μž„ν¬νŠΈν•  것이닀.

# 데이터 μž„ν¬νŠΈ, μ „μ²˜λ¦¬λ₯Ό μœ„ν•œ pandas, numpy library μž„ν¬νŠΈ
import pandas as pd
import numpy as np
# μ‹œκ°ν™”λ₯Ό μœ„ν•œ plotly library μž„ν¬νŠΈ
import plotly.graph_objects as go
import plotly.offline as pyo
pyo.init_notebook_mode()

🚨 λ¨Όμ € 데이터λ₯Ό λΆˆλŸ¬μ™€λ³΄λ„λ‘ ν•˜μž.

cardio = pd.read_csv('C:\\Users\mingu\Desktop\\cardio_train.csv', sep=';')
cardio 


🚨 μ°¨ν›„ 진행을 μœ„ν•΄ 이름을 cardio 라고 λΆ™μ˜€κ³ , 일반적인 CSV νŒŒμΌμ€ 콀마(,) 둜 ꡬ뢄이 λ˜κΈ°μ— pd.read_csv() λ§Œμ„ μ‚¬μš©ν•˜μ—¬ 뢈러올 수 μžˆμ§€λ§Œ λ‚΄κ°€ μ‚¬μš©ν•œ λ°μ΄ν„°λŠ” μ„Έλ―Έμ½œλ‘ (;) 으둜 κ΅¬λΆ„λ˜μ–΄ μžˆμ—ˆκΈ° λ•Œλ¬Έμ— sep=’;’ μ˜΅μ…˜μ„ λ„£μ–΄ 데이터λ₯Ό λΆˆλŸ¬μ™”λ‹€.

🚨 각 attributeκ°€ 무엇을 μ˜λ―Έν•˜λŠ”μ§€ μ‚΄νŽ΄λ³΄μž.


  • λ‚˜μ΄
  • 성별(1-women, 2-men)
  • ν‚€(cm)
  • λͺΈλ¬΄κ²Œ(kg)
  • ap_hi(systolic blood pressure, μˆ˜μΆ•ν˜ˆμ••)
  • ap_lo(diastolic blood pressure, μ΄μ™„ν˜ˆμ••)
  • cholesterol(1-normal, 2-above normal, 3-well above normal)
  • gluc(ν˜ˆλ‹Ή)(1-normal, 2-above normal, 3-well above normal)
  • smoke(0-비흑연, 1-흑연)
  • alco(0-음주X, 1-음주O)
  • active(μš΄λ™μ—¬λΆ€)(0-X, 1-O)
  • Cardio(target)(0-X, 1-O)

🚨 뢀가적인 μ „μ²˜λ¦¬κ°€ ν•„μš”ν•˜κ² μ§€λ§Œ, κ²°λ‘ μ μœΌλ‘œλŠ” μƒμœ„ 11개의 attributeλ₯Ό 가지고 λ§ˆμ§€λ§‰ Cardio attribute λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 것이 μ΅œμ’…μ μΈ ν”„λ‘œμ νŠΈμ˜ λͺ©ν‘œμ΄λ‹€.

🚨 μ „μ²˜λ¦¬μ— λŒ€ν•΄μ„œλŠ” λ‹€μŒ μ—…λ‘œλ“œμ—μ„œ λ‹€λ£° μ˜ˆμ •μ΄λ‹€.


Leave a comment