𧩠λ°μ΄ν°λ§μ΄λ(25) ν¨ν΄λΆμ_5 : Pattern Evaluation(2)
𧩠μ€λλ§μ λΈλ‘κ·Έμ κΈμ μ΄λ€. κ°κ°νκ³ μ΄κ²μ κ² μ²λ¦¬ν κ²λ μμκ³ , μμλ³Ό κ²λ μμ΄μ μ κΉ λΈνλ€. μ΄λ² νκΈ°λ κ·Έλλ μ λ² ν기보λ€λ μ΄μ§ μ¬μ λ‘κ² μμ μ λ€μ μ μμ΄μ λΈλ‘κ·Έμ μ’ λ μ κ²½μ μΈ μ μμ κ² κ°μ λ€νμ΄λ€ππ. κ·Έλμ λ£κ³ μΆμλ νμ΄λΈμ€μ΄λΌλ¦¬ν±μ€μ μλͺ μ 보νμ λλμ΄ λ£κ² λμ κΈ°λκ° λλ νκΈ°μ΄λ€. λκ·Όλκ·Ό!!
𧩠μ λ² ν¬μ€ν
μμλ supportμ confidenceλ₯Ό 보μν μ μλ Liftμ chi-square testμ λν΄μ μμ보μλ€. νμ§λ§ μ΄ μΉκ΅¬λ€μ null ransactionμ μν₯μ λ무 λ§μ΄ λ°κΈ° λλ¬Έμ λ€λ₯Έ λ°©λ²μ΄ νμνλ€λ κ²μ΄ μ λ² ν¬μ€ν
μ λ΄μ©μ΄μλ€. μ΄λ² ν¬μ€ν
μμλ κ·Έ λ€λ₯Έ λ°©λ²λ€μΈ Null-Invariant Measureμ λν΄μ μμλ³Ό κ²μ΄λ€.
1. Null-Invariant Measure
𧩠μμ λ°μ΄ν°μ²λΌ λ itemsetμ΄ λͺ¨λ null κ°μ κ°μ§λ κ²½μ°μλ μμμ λ°°μ΄ Liftμ chi-square testκ° μ’μ λ°©λ²μ΄ μλ κ°λ₯μ±μ΄ ν¬λ€. λ°λΌμ μμμ λ§νλ―μ΄ λ€λ₯Έ λ°©λ²λ€μ΄ νμν΄μ‘κ³ , μ΄λ μ¬μ©νλ λ°©λ²λ€κ³Ό μμμ μλμ κ°λ€.
π $Allconf(A,B)\;\;=\;\;\frac{s(A\cup{B})}{max(s(A),\,s(B))}\;\;and\;\;\;range\,:\,[0,1]$
π $Jaccard(A,B)\;\;=\;\;\frac{s(A\cup{B})}{s(A)+s(B)-s(A\cup{B})}\;\;and\;\;\;range\,:\,[0,1]$
π $Cosine(A,B)\;\;=\;\;\frac{s(A\cup{B})}{\sqrt{s(A)\times{s(B)}}}\;\;and\;\;\;range\,:\,[0,1]$
π $Kulczynski(A,B)\;\;=\;\;\frac{1}{2}(\frac{s(A\cup{B})}{s(A)}+\frac{s(A\cup{B})}{s(B)})\;\;and\;\;\;range\,:\,[0,1]$
π $MaxConf(A,B)\;\;=\;\;max(\frac{s(A\cup{B})}{s(A)}, \frac{s(A\cup{B})}{s(B)})\;\;and\;\;\;range\,:\,[0,1]$
𧩠null transactionμ μν₯μ λ°μ§ μλ μ΄λ¬ν λ°©λ²λ€μ ν΅ν΄μ itemset Aμ B μ¬μ΄μ λ³΄λ€ μ νν κ΄κ³λ₯Ό ννν μκ° μλ€. μ΄ μ€μμλ νΉν Kulczynski Measure λ₯Ό λ§μ΄ μ¬μ©νλ€. μ΄λ λ itemsetμ΄ μλ‘ μΌλ§λ μ€λ¦½μ μΈ κ΄κ³λ₯Ό κ°μ§κ³ μλμ§λ₯Ό λνλ΄λ κ²μΌλ‘, κ·Έ κ°μ΄ 0.5μ κ°κΉμΈμλ‘ neutral νλ€κ³ ν μ μλ€. κ²°κ³Όμ μΌλ‘ μ΄λ€μ κ΄κ³κ° positiveνμ§, negativeνμ§λ μ μ μλ μ€μν λ°©λ²μ΄λ€. λ itemset κ°μ κ΄κ³λ₯Ό μ νννκΈ° μν΄ μ΄ λ°©λ²κ³Ό λμμ μ¬μ©νλ Measureκ° νλ μλ€. μ΄λ₯Ό Imbalance Ratio λΌκ³ νλλ°, μμμ μλμ κ°λ€.
π $Imbalanced\;Ratio\;=\;IR(A,B)\;=\;\frac{\left\vert{s(A)-s(B)}\right\vert}{s(A)+s(B)-s(A\cup{B})}\;\;and\;\;\;range\,:\,[0,1]$
𧩠IR μ λ itemset μ€ νλμ λ°μλΉλκ° λ€λ₯Έ κ²μ λ°μλΉλλ³΄λ€ ν°μ§ μμμ§λ₯Ό λνλ΄λ measure μ΄λ€. κ°μ΄ 0μ κ°κΉμΈμλ‘ balanced, 1μ κ°κΉμΈμλ‘ imbalanced λΌκ³ ν μ μλ€.
β Kulczynskiλ₯Ό ν΅ν΄μ λ°μ΄ν°κ° μΌλ§λ neutral νμ§λ μ μ μμ§λ§, λ°μ΄ν°λ itemsetμ΄ μ΄λ νμͺ½μΌλ‘ μΉμ°μ³€λκ° μ¬λΆλ μ νν μ μ μκΈ° λλ¬Έμ, IRμ ν¨κ» μ¬μ©ν¨μΌλ‘μ¨ λ itemsetμ balance ν¨μ νλ¨νλ€.
𧩠Kulczynskiμ Imbalanced Ratio λ₯Ό ν΅ν λΆμμ μλ₯Ό λ³΄κ³ κ°λλ‘ νμ.
π§© κ²°κ΅ μ°λ¦¬κ° μ΄λκΉμ§ λ°°μ΄ μλ§μ λ°©λ²λ€ μ€μμ λ°μ΄ν°κ° null transactionμ μν₯μ λ§μ΄ λ°μ μ μλ κ²½μ°μλ κ°μ₯ μ μ μ©λ μ μλ λ°©λ²μ Kulczynskiμ Imbalanced Ratio λΌκ³ ν μ μμ κ² κ°λ€ππ.
𧩠μ΄λ κ² ν΄μ ν¨ν΄λΆμμ λν λ΄μ©κΉμ§ μμ보μλ€. λ€μ ν¬μ€ν μμλ μ§λ νκΈ°μ μ§νν νλ‘μ νΈλ₯Ό λ°νμΌλ‘ μ΄ λ°©λ²λ€μ μ΄λ»κ² ꡬννκ³ κ²°κ³Όλ₯Ό λΆμν μ μλμ§ μμ보λλ‘ νμ.
Leave a comment