𧩠λ°μ΄ν°λ§μ΄λ(2) Introduction
𧩠λ°μ΄ν°λ§μ΄λμ 첫λ²μ§Έ ν¬μ€ν μ λλ€. μ΄λ² ν¬μ€ν μμλ κ°λ¨νκ² λ°μ΄ν°λ§μ΄λμ΄ λ¬΄μμΈμ§ κ°λ μμ£Όλ‘ μ΄ν΄λ³΄κ³ μ ν©λλ€.
1. λ°μ΄ν° λ§μ΄λμ΄λ??
-
κΈ°μ‘΄μ λ°μ΄ν°μμ μλ―Έμλ ν¨ν΄μ΄λ μ§μμ μ»λ κ²μ λλ€.
-
λ€λ§, κ°λ¨ν κ²μμ΄λ μ ννλ κ·μΉμ κΈ°λ°μΌλ‘ μμ νλ κ²μ λ°μ΄ν°λ§μ΄λμ΄λΌκ³ 보기 μ΄λ ΅μ΅λλ€.
2. λ°μ΄ν°λ§μ΄λ μμ
-
λ°μ΄ν° κ²°μ : time-series / sequence / text / graphs / socialβ¦
-
λμΆν insight κ²°μ : classification / clustering / trend / deviationβ¦
-
μ μ© κΈ°μ κ²°μ : machinelearning / deeplearning / statics / patternβ¦
-
μ μ©ν λλ©μΈ κ²°μ : retail / banking / bio-data / stack / textβ¦
-
λ°μ΄ν° νμ μ λ§λ λ°©λ²μ μ¬μ©ν΄μ λ§μ΄λμ μ§νν΄μΌ ν©λλ€.
π Data Cleaning βΆ Integration βΆ Selection βΆ Transform βΆ Data Mining βΆ Pattern Evaluation βΆ Knowledge Presentation
π κ°κ°μ μμμμ μ¬μ©νλ κΈ°λ²λ€μ μμΌλ‘ ν¬μ€ν ν μμ μ λλ€!!
3. λ°μ΄ν°λ§μ΄λμ Function
-
λ°μ΄ν°λ§μ΄λμ μ μλ―Έν ν¨ν΄μ μμλ΄λ κ²μ λλ€. λ°λΌμ μ΄λ₯Ό μν functionλ€μ΄ μ‘΄μ¬ν©λλ€.
- Generalization
- Information Integration & Data warehouse construction
- Data Cube
- κ°μ§κ³ μλ μ 보λ€μ ν΅ν΄ λ€μν κ°λλ‘ λ°μ΄ν°λ₯Ό μΌλ°ν.
- λμ©λμ λ°μ΄ν°λ₯Ό λ€λ£¨λ κ²½μ°μ μ£Όλ‘ μ¬μ©.
- Pattern Discovery
- λ°μ΄ν° / Attribute κ°μ κ΄κ³μ ν¨ν΄μ λ°κ²¬
- ex) Frequent Patterns / Correlation Analysis
- Classification
- Supervised learning with training data (examples)
- μλ €μ§μ§ μμ classλ₯Ό μμΈ‘νλ κ² (label)
- support vector machine / deep learning / bayesian / decision tree / logistic regressionβ¦
- Clustering
- Unsupervised learning
- classλ₯Ό λͺ¨λ₯΄λ μνλ‘ μ μ¬ν λ°μ΄ν°λΌλ¦¬ κ΅°μ§ν
- λ¬Άκ³ λ΄€λλ λ¬ΆμΈ λ°μ΄ν°λ€μ νΉμ§μ΄ μ΄λ¬μ΄λ¬νλλΌλ₯Ό νλ¨
- rule : Maximizing intraclass similarity & Minimizing interclass similarity
π κ°μ κ·Έλ£Ή λ΄ μ μ¬μ± μ΅λν & λ€λ₯Έ κ·Έλ£ΉλΌλ¦¬μ μ μ¬μ± μ΅μν
- Outlier Analysis
- λ°μ΄ν°κ° λ Έμ΄μ¦μΈμ§, νμ°μ μΌλ‘ μκΈ΄ νΉμ΄ μΌμ΄μ€μΈμ§ ꡬλΆ
- fraud detection / rare events analysis
- Time & Ordering
- μ£Όμ, μ£Όκ°, ννμ²λΌ μ£ΌκΈ°μ μΌλ‘ λ°μνλ ν¨ν΄ λΆμ
- Sequential Pattern, μκ°μ μμκ΄κ³ κ³ λ €
- μ μ μ μνμ€ λΆμ, μ μ¬μ± νμ
- Structure & Network
- κ·Έλν λ§μ΄λ, λ€νΈμν¬ λΆμ, μΉ λ§μ΄λ
- Major Issues
- ν¨μ¨μ μΈ μκ³ λ¦¬μ¦μΈκ°
- λ°μ΄ν° μμ΄ μ¦κ°νμ λλ μ μ μ©λλκ°
- λ°μ΄ν°μ ννμ λ°λΌ λ¬λΌμ§λκ°
- μ¬νμ μΌλ‘ μ¬μ© κ°λ₯ν λ°μ΄ν°μΈκ° ex) νλΌμ΄λ²μ
𧩠μ΄λ κ² ν΄μ κ°λ¨νκ² λ°μ΄ν°λ§μ΄λμ΄ λμ§, μ°λ¦¬κ° μ κ²½μ¨μΌ ν λΆλΆμ΄ μ΄λμΈμ§, κ·Έλ¦¬κ³ μΌλ§λ λ€μν μν©μ μ¬μ©λ μ μλμ§λ₯Ό κ°λ΅νκ² μμ보μμ΅λλ€. λ€μ ν¬μ€ν μμλ λ°μ΄ν°μ object κ°μ μ μ¬μ±μ νλ¨νκΈ° μν Distance measureμ λν΄ μμλ³Ό κ²μ λλ€π.
Leave a comment