๐Ÿงฉ ์ €๋ฒˆ ํฌ์ŠคํŒ…๋“ค์„ ํ†ตํ•ด์„œ ๋ฐ์ดํ„ฐ๋“ค์˜ ๊ธฐ๋ณธ์ ์ธ ํŠน์ง•๋“ค์„ ์•Œ์•„๋ณด์•˜๋‹ค. ์ด๋ฒˆ ํฌ์ŠคํŒ…๋ถ€ํ„ฐ๋Š” ๋ณธ๊ฒฉ์ ์œผ๋กœ Distance measure์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋„๋ก ํ•˜์ž.

1. Similarity / Dissimilarity

  • Similarity
    • ๋ฐ์ดํ„ฐ๋“ค์˜ ์œ ์‚ฌํ•œ ์ •๋„
    • ๋ฒ”์œ„ : [0,1]
    • 0 : No Similarity
    • 1 : Completely Similar
  • Dissimilarity
    • ๋ฐ์ดํ„ฐ๋“ค์˜ ๋‹ค๋ฅธ ์ •๋„ (= distance)
    • ๋ฒ”์œ„ : [0,1]
    • 0 : No Distance
    • 1 : Completely Dissimilar

๐Ÿงฉ ์œ„์˜ ๋‘ ์นœ๊ตฌ๋“ค์„ ๋น„๊ตํ•ด๋ณด๋ฉด ์•Œ๊ฒ ์ง€๋งŒ ์„œ๋กœ ์ •๋ฐ˜๋Œ€์˜ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„๋‹ค. ๋‘ ๊ฐœ๋… ๋ชจ๋‘ ๊ฐ™์€ ๋ฒ”์œ„๋ฅผ ๊ฐ€์ง€์ง€๋งŒ, ๊ทธ ๊ฐ’์ด ์˜๋ฏธํ•˜๋Š” ๋ฐ”๋Š” ์ •๋ฐ˜๋Œ€๋ผ๊ณ  ์ดํ•ดํ•˜๋ฉด ๋  ๋“ฏ ํ•˜๋‹ค. ์ด ๋‘ ๊ฐœ๋…์„ ๋จผ์ € ๋‹ค๋ฃจ๋Š” ์ด์œ ๋Š”, ์•ž์œผ๋กœ ์„ค๋ช…ํ•  ๋‚ด์šฉ๋“ค์—์„œ ๊ณ„์†ํ•ด์„œ ๋“ฑ์žฅํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

๐Ÿงฉ ๊ทธ๋ฆฌ๊ณ  ์œ„์˜ ๋‘ ๊ฐœ๋…๋“ค์„ ํ†ตํ•ฉํ•ด์„œ Proximity๋ผ๊ณ  ํ•œ๋‹ค.


2. Dissimilarity Matrix

๐Ÿงฉ ์ด๋ฒˆ์—๋Š” ๋‘ object ๋“ค ์‚ฌ์ด์˜ Distance๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” Matrix์ธ Dissimilarity Matrix์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž. ๋ณด๋‹ค ํŽธํ•œ ์ดํ•ด๋ฅผ ์œ„ํ•ด ์•ž์„œ์„œ ์„ค๋ช…ํ•œ Data Set์˜ ๊ตฌ์กฐ๋ฅผ ์ข€ ๋” ์ž์„ธํžˆ ๋‚˜ํƒ€๋‚ด์ค„ ๊ฒƒ์ด๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์•ž์œผ๋กœ๋Š” ์ด ๊ตฌ์กฐ๋ฅผ Data Matrix๋ผ๊ณ  ๋ถ€๋ฅด์ž.

๐Ÿ“Data Matrix

ย  feature 1 feature2 feature3 โ€ฆ feature m
d 1 x11 x12 x13 โ€ฆ x1m
d 2 x21 x22 x23 โ€ฆ x2m
โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ
d n xn1 xn2 xn3 โ€ฆ xnm

๐Ÿ‘‰ ์œ„์˜ Data Matrix๋ฅผ ๋ณด๋ฉด ์•Œ ์ˆ˜ ์žˆ์ง€๋งŒ ์œ„ ๊ตฌ์กฐ๋Š” m๊ฐœ์˜ feature๋กœ ํ‘œํ˜„๋˜๋Š” n๊ฐœ์˜ object๋กœ ์ด๋ฃจ์–ด์ง„๋‹ค. ์ฆ‰, (n x m) matrix์ด๋‹ค.

๐Ÿงฉ ์ด์ œ๋Š” ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ•ด์„œ Dissimilarity Matrix๋ฅผ ๋งŒ๋“ค ์ƒ๊ฐ์ธ๋ฐ, ์ด๋ฅผ ์œ„ํ•ด์„œ ์šฐ๋ฆฌ๋Š” ๋น„๊ตํ•˜๊ณ  ์‹ถ์€ ํ•˜๋‚˜์˜ feature๋ฅผ ๊ณจ๋ผ์˜ฌ ๊ฒƒ์ด๋‹ค. ๊ทธ๋ ‡๊ฒŒ ๋งŒ๋“ค์–ด์ง€๋Š” ๊ตฌ์กฐ๋Š” ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™๋‹ค.

๐Ÿ“Dissimilarity Matrix

ย  d 1 d 2 d 3 โ€ฆ d n
d 1 d(1,1) d(1,2) d(1,3) โ€ฆ d(1,n)
d 2 d(2,1) d(2,2) d(2,3) โ€ฆ d(2,n)
d 3 d(3,1) d(3,2) d(3,3) โ€ฆ d(3,n)
โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ โ€ฆ
d n d(n,1) d(n,2) d(n,3) โ€ฆ d(n,n)

๐Ÿ‘‰ ๊ฐ๊ฐ์˜ d(i,j)๋Š” ํ•˜๋‚˜์˜ feature์— ๋Œ€ํ•ด ์ •ํ•ด๋‘” Distance Measure๋ฅผ ํ†ตํ•ด ๊ตฌํ•œ objec i์™€ object j์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ด๋ฅผ ํ†ตํ•ฉํ•ด์„œ Matrix ํ˜•ํƒœ๋กœ ํ‘œํ˜„ํ•œ๋‹ค. ์ด๋•Œ ์ž๊ธฐ ์ž์‹ ๊ณผ์˜ distance๋Š” ๋‹น์—ฐํžˆ 0์ด๊ณ , d(1,2)์™€ d(2,1)์€ ์„œ๋กœ ๊ฐ™์€ object๋“ค ๊ฐ„์˜ ๋น„๊ต์ด๊ธฐ ๋•Œ๋ฌธ์— ์„œ๋กœ ๊ฐ™์€ ๊ฐ’์„ ๊ฐ€์ง„๋‹ค. ๋”ฐ๋ผ์„œ, Symmetric(๋Œ€์นญ์„ฑ)์— ์˜ํ•ด ์ด Matrix๋Š” ์•„๋ž˜์™€ ๊ฐ™์ด ํ‘œํ˜„๋˜๊ธฐ๋„ ํ•œ๋‹ค.

ย  d 1 d 2 d 3 โ€ฆ d n
d 1 0 ย  ย  ย  ย 
d 2 d(2,1) 0 ย  ย  ย 
d 3 d(3,1) d(3,2) 0 ย  ย 
โ€ฆ โ€ฆ โ€ฆ โ€ฆ 0 ย 
d n d(n,1) d(n,2) d(n,3) โ€ฆ 0

๐Ÿงฉ ์•ž์„œ ๋งํ–ˆ๋“ฏ์ด ์ด distance๋ฅผ ๊ตฌํ•˜๊ธฐ ์œ„ํ•œ measure๋ฅผ ๋ฏธ๋ฆฌ ์ •ํ•ด์ฃผ๋Š”๋ฐ, ์ด measure๋“ค์€ variables์˜ ์ž๋ฃŒํ˜•์— ๋”ฐ๋ผ ์„ ํƒํ•˜๋Š” ๊ธฐ์ค€์ด ๋‹ฌ๋ผ์ง„๋‹ค. ์ด ๋‚ด์šฉ๋“ค์€ ๋‹ค์Œ ํฌ์ŠคํŒ…์—์„œ ์†Œ๊ฐœํ•  ๊ฒƒ์ด๋‹ค.


๐Ÿงฉ ์ด๋ ‡๊ฒŒ ํ•ด์„œ ์•ž์œผ๋กœ Distance๋“ค์„ ์ •๋ฆฌํ•  Matrix์˜ ์ƒ์„ฑ๊นŒ์ง€ ๋ฐฐ์›Œ๋ณด์•˜๋‹ค. ๋‹ค์Œ ํฌ์ŠคํŒ…๋ถ€ํ„ฐ๋Š” ์ด๋ฅผ ์œ„ํ•œ Distance Measure๋ฅผ ์•Œ์ฐจ๊ฒŒ ๋ฐฐ์›Œ๋ณด๋„๋ก ํ•˜์ž๐Ÿ˜€๐Ÿ˜€.


๐Ÿ’ก์œ„ ํฌ์ŠคํŒ…์€ ํ•œ๊ตญ์™ธ๊ตญ์–ด๋Œ€ํ•™๊ต ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ๊ณตํ•™๋ถ€ ๊ณ ์œคํฌ ๊ต์ˆ˜๋‹˜์˜ [์ƒ๋ช…์ •๋ณดํ•™์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹] ๊ฐ•์˜ ๋‚ด์šฉ์„ ๋ฐ”ํƒ•์œผ๋กœ ํ•จ์„ ๋ฐํž™๋‹ˆ๋‹ค.

Leave a comment