๐Ÿงฉ ์ €๋ฒˆ ํฌ์ŠคํŒ…๋ถ€ํ„ฐ Dimensionality Reduction์„ ๋‹ค๋ฃจ๊ณ  ์žˆ๋Š”๋ฐ, ์ด๋ฒˆ์—๋Š” ๊ฝƒ์ด๋ผ๊ณ  ํ• ์ˆ˜ ์žˆ๋Š” Principal Component Analysis, ์ฃผ์„ฑ๋ถ„ ๋ถ„์„์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณด๋„๋ก ํ•˜์ž๐Ÿ™ƒ๐Ÿ™ƒ.


1. PCA - Dimensionality Reduction

๐Ÿงฉ ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹ ๋ถ„์•ผ์— ์กฐ๊ธˆ์ด๋ผ๋„ ๊ด€์‹ฌ์ด ์žˆ๊ฑฐ๋‚˜, ๊ด€๋ จ๋œ ์„œ์ ์„ ์ฝ์–ด๋ณธ ์‚ฌ๋žŒ๋“ค์€ PCA ๋ผ๋Š” ๋ง์„ ์ด๋ž˜์ €๋ž˜ ๋งŽ์ด ์ ‘ํ•ด๋ดค์„ ๊ฒƒ์ด๋‹ค. ๋Œ€๋ถ€๋ถ„ ์•Œ๊ณ  ์žˆ๊ฒ ์ง€๋งŒ, Principal Component Analysis๋ฅผ ์ค„์—ฌ์„œ ๋ถ€๋ฅธ ๊ฒŒ ๋ฐ”๋กœ PCA ๋ถ„์„์ด๋‹ค. ๊ทธ๋งŒํผ ์œ ๋ช…ํ•˜๊ณ , ๋ฐ์ดํ„ฐ ๋ถ„์•ผ์—์„œ๋Š” ๋–ผ์–ด๋†“์„ ์ˆ˜ ์—†์„ ๋งŒํผ ์ค‘์š”ํ•˜์ง€๋งŒ ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹ ํ”„๋ ˆ์  ํ…Œ์ด์…˜์„ ๋ดค์„ ๋•Œ PCA๊ฐ€ ๋ฌด์—‡์ธ์ง€, ์™œ ํ•˜๋Š”์ง€์— ๋Œ€ํ•ด ์ •ํ™•ํžˆ ์•Œ๊ณ  ๋Œ€๋‹ตํ•˜๋Š” ๊ฒƒ์„ ๋“ค์€ ์ ์€ ๊ฑฐ์˜ ์—†๋‹ค. ๋˜ํ•œ ์ธํ„ฐ๋„ท์„ ์ฐพ์•„๋ณด์•„๋„ ๋Œ€๋ถ€๋ถ„ ์ˆ˜์‹์ด๋‚˜ ๋จธ์‹ ๋Ÿฌ๋‹์— ์‚ฌ์šฉ๋˜๋Š” PCA๋ฅผ ๋‹ค๋ฃจ๊ณ  ์žˆ๋‹ค. ์ฆ‰, ์ •ํ™•ํ•œ ๊ฐœ๋…์— ๋Œ€ํ•ด ๋‹ค๋ฃจ๋Š” ๋‚ด์šฉ์€ ๊ฑฐ์˜ ๋ณธ ์ ์ด ์—†๋‹ค. ๋”ฐ๋ผ์„œ ์ด๋ฒˆ ํฌ์ŠคํŒ…์—์„œ๋Š” PCA์˜ ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ๊ฐœ๋…์— ๋Œ€ํ•ด ๋‹ค๋ฃฐ ๊ฒƒ์ด๋‹ค. ์ •๋ง ์‰ฝ๊ฒŒ ์„ค๋ช…ํ•  ๊ฒƒ์ด๊ธฐ ๋–„๋ฌธ์—, ์ฒœ์ฒœํžˆ ์ฝ์–ด๋ณด์‹œ๋ฉด ์ดํ•ดํ•˜๋Š” ๋ฐ ์–ด๋ ค์šด ์ ์€ ์—†์„ ๊ฑฐ๋ผ ์ƒ๊ฐํ•œ๋‹ค.

๐Ÿงฉ ํ•™๊ต์—์„œ ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹ ๊ณผ๋ชฉ์„ ์ˆ˜๊ฐ•ํ• ๋•Œ ์‚ฌ์šฉํ•œ ๊ต์žฌ์—์„œ๋Š” PCA๋ฅผ ์•„๋ž˜์™€ ๊ฐ™์ด ์ •์˜ํ•œ๋‹ค.

Transfer a set of correlated variables
into a new set of uncorrelated variables.


์ด๋ฅผ ๋‹จ์ˆœํžˆ ๋ฒˆ์—ญํ•ด๋ณด๋ฉด ๊ด€๋ จ๋œ ๋ณ€์ˆ˜๋“ค์„ ์„œ๋กœ ๊ด€๋ จ์ด ์—†๋Š” ๋ณ€์ˆ˜๋“ค์˜ set์œผ๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค๋Š” ๋‚ด์šฉ์ธ๋ฐ, ์‚ฌ์‹ค ์œ„์˜ ์ •์˜๋งŒ ๋ณด๊ณ  ์ •ํ™•ํ•œ ๊ฐœ๋…์„ ์ดํ•ดํ•˜๊ธฐ๋Š” ์–ด๋ ต๋‹ค. ๊ทธ๋ž˜์„œ ๊ต์ˆ˜๋‹˜๊ป˜๋„ ์งˆ๋ฌธ๋“œ๋ ค๋ณด๊ณ , ๊ด€๋ จ๋œ ๊ธ€๋“ค์„ ์ฐพ์•„ ์ฝ์€ ๊ฒฐ๊ณผ ๊ฐ€์žฅ ๊น”๋”ํ•˜๊ฒŒ ์ •๋ฆฌํ•œ ์ •์˜๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

๊ธฐ์กด์˜ attributes๋ฅผ linear combinationํ•ด์„œ ์ƒˆ๋กœ์šด attributes๋ฅผ ๋งŒ๋“œ๋Š” ๊ฒƒ.
๊ทธ๋ฆฌ๊ณ  ๊ทธ ์ƒˆ๋กœ์šด attributes๊ฐ€ ์ƒˆ๋กœ์šด ์ถ•์ธ principal component๋กœ ์ •์˜๋จ.
๊ธฐ์กด์˜ ๋ฐ์ดํ„ฐ๋“ค์€ ์ƒˆ๋กœ์šด ์ถ• PC1, PC2...์—์„œ ์ƒˆ๋กœ์šด ์ขŒํ‘œ๋ฅผ ๊ฐ€์ง€๊ฒŒ ๋จ.


์ด๋ ‡๊ฒŒ ์›๋ž˜ attribute๋“ค์„ linear combination๋“ฑ์˜ ์—ฐ์‚ฐ์„ ํ†ตํ•ด combineํ•˜๋Š” ๊ณผ์ •์—์„œ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฐ„๋žตํ•ด์ง€๊ณ , ๊ทธ dimension ์—ญ์‹œ ์ค„์–ด๋“ ๋‹ค๋Š” ์˜๋ฏธ์ด๋‹ค. ์ด๋ฅผ ๊ทธ๋ฆผ์œผ๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์œ„์˜ ๊ทธ๋ฆผ์—์„œ ์ƒˆ๋กญ๊ฒŒ ๋งŒ๋“ค์–ด์ง„ ๋ฐ์ดํ„ฐ์˜ ๊ฐ๊ฐ์˜ attribute์ธ PC1, PC2,โ€ฆ(Principal Component์˜ ์•ฝ์ž) ๊ฐ€ ์ƒˆ๋กญ๊ฒŒ ์ขŒํ‘œ๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•œ ์ถ•์„ ํ˜•์„ฑํ•˜๊ฒŒ ๋˜๊ณ , ์šฐ๋ฆฌ๊ฐ€ ์›๋ž˜ ๊ฐ€์ง€๊ณ  ์žˆ๋˜ ๋ฐ์ดํ„ฐ๋Š” ์ƒˆ๋กœ์šด ์ขŒํ‘œํ‰๋ฉด์—์„œ ํ‘œํ˜„๋œ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์ด์ œ ํ•˜๋‚˜์˜ ์งˆ๋ฌธ์ด ์ƒ๊ธด๋‹ค. ์ƒˆ๋กœ์šด attribute๋ฅผ ๋งŒ๋“œ๋Š” ๊ฒƒ์€ ์ดํ•ด๊ฐ€ ๊ฐ€๋Š”๋ฐ, ๊ทธ๋Ÿฌ๋ฉด ๊ทธ ์ˆœ์„œ๋Š” ์–ด๋–ป๊ฒŒ ์ •ํ•ด์ง€๋Š” ๊ฒƒ์ผ๊นŒ๐Ÿ™„??


2. PCA - New Axis

๐Ÿงฉ ์ด๋ฒˆ ์ ˆ์—์„œ๋Š” ์œ„์˜ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋Œ€๋‹ต๊ณผ ์ „๋ฐ˜์ ์ธ PCA๋ถ„์„์˜ ๊ฒฐ๊ณผ๋ฅผ ๋‹ค๋ฃฐ ๊ฒƒ์ด๋‹ค.

๐Ÿšฉ ๊ฐ€์žฅ ๋จผ์ € ์œ„์˜ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋‹ต์„ ํ•˜์ž๋ฉด, ์ƒˆ๋กœ์šด attribute๊ฐ€ ๋งŒ๋“ค์–ด์ง€๋Š” ์ˆœ์„œ๋Š” ๊ธฐ์กด ๋ฐ์ดํ„ฐ์˜ variance๋ฅผ ๊ฐ€์žฅ ์ž˜ ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋Š” ์ถ•์˜ ์ˆœ์„œ๋Œ€๋กœ ์ด๋ฆ„์„ ๋ถ™์ด๋Š” ๊ฒƒ์ด๋‹ค. ์ด ์ „ํ›„๊ด€๊ณ„๋ฅผ ํ˜ผ๋™ํ•˜์ง€ ์•Š์œผ๋ฉด ์ข‹๊ฒ ๋Š”๋ฐ, ๋งŒ๋“œ๋Š” ์กฑ์กฑ ์ˆœ์„œ๋ฅผ ๋งค๊ธฐ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์ƒˆ๋กœ์šด ์ถ•๋“ค์„ ๋งŒ๋“  ๋’ค์— ๊ทธ ์ถ•๋“ค์„ ๊ธฐ์ค€์œผ๋กœ ์›๋ž˜ ๋ฐ์ดํ„ฐ์˜ variance๋ฅผ ์ž˜ ์„ค๋ช…ํ•˜๋Š” ์ˆœ์„œ๋Œ€๋กœ ๋ฒˆํ˜ธ๋ฅผ ๋งค๊ธฐ๋Š” ๊ฒƒ์ด๋‹ค. ์ฆ‰ PC1 ์ด ์›๋ณธ ๋ฐ์ดํ„ฐ์˜ variance๋ฅผ ๊ฐ€์žฅ ์ž˜ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๊ณ , ๊ทธ ๋‹ค์Œ์€ PC2๊ฐ€, ๊ทธ ๋’ค๋Š” PC3๊ฐ€โ€ฆ ์ด๋Ÿฐ ์ˆœ์„œ๋Œ€๋กœ ์ด๋ฆ„์„ ๋ถ™์—ฌ๋‚˜๊ฐ€๋Š” ๊ฒƒ์ผ ๋ฟ์ด๋‹ค.

๐Ÿšฉ ๊ทธ๋ฆฌ๊ณ  attribute๋ฅผ combineํ•ด์„œ ์ƒˆ๋กœ์šด ์ถ•์„ ๋งŒ๋“ค๋•Œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ ์ด ์žˆ๋‹ค. ๋จผ์ € ์•ž์„œ ๋งํ–ˆ๋“ฏ์ด ์šฐ๋ฆฌ๋Š” ์ด ์ƒˆ๋กœ์šด ์ถ•์„ ๋ฐ”ํƒ•์œผ๋กœ ์›๋ž˜ ๋ฐ์ดํ„ฐ์— ์ƒˆ๋กœ์šด ์ขŒํ‘œ๋ฅผ ๋ถ€์—ฌํ•  ๊ฒƒ์ด๋‹ค (์ด๋ฅผ projection์ด๋ผ ํ•œ๋‹ค). ๊ทธ๋Ÿฐ๋ฐ ์šฐ๋ฆฌ๊ฐ€ ํ”ํžˆ ์•Œ๊ณ  ์žˆ๋Š” xyํ‰๋ฉด์„ ์˜ˆ๋กœ ๋“ค์–ด๋ณด๋ฉด, ๋‘ ์ถ•์€ ์„œ๋กœ ์ง๊ตํ•œ๋‹ค. ์ฆ‰, ์„œ๋กœ orthogonalํ•˜๋‹ค. ๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒˆ๋กœ์šด ํ‰๋ฉด์—์„œ ํ‘œํ˜„ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š”, ๊ฐ๊ฐ์˜ ๋งŒ๋“ค์–ด์ง€๋Š” ์ƒˆ๋กœ์šด ์ถ•๋“ค์ธ Principal Component๋“ค ๋˜ํ•œ ์„œ๋กœ orthogonal ํ•ด์•ผํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

๐Ÿšฉ ์„ ํ˜•๋Œ€์ˆ˜ํ•™์„ ์•Œ๊ณ  ์žˆ๋‹ค๋ฉด eigen vector์™€ eigen value์— ๋Œ€ํ•ด์„œ ์•Œ๊ณ  ์žˆ์„ ๊ฒƒ์ด๋‹ค. ๊ฐ„๋žตํžˆ ์„ค๋ช…ํ•˜์ž๋ฉด ์ •์‚ฌ๊ฐ ํ–‰๋ ฌ A๊ฐ€ ์ฃผ์–ด์กŒ์„ ๊ฒฝ์šฐ์— ์ ๋‹นํ•œ ์ˆ˜ ฮป์— ๋Œ€ํ•˜์—ฌ Ax๏ผฮปx๋ฅผ ๋งŒ์กฑํ•˜๋Š” zero vector ์ด์™ธ์˜ ๋ฒกํ„ฐ x๋ฅผ eigen vector๋ผ ํ•˜๊ณ , ์ด๋•Œ ๊ณฑํ•ด์ง€๋Š” ์ ๋‹นํ•œ ์ˆ˜ ฮป๋ฅผ eigen value๋ผ๊ณ  ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  PCA ์—์„œ๋Š” ๋ฐ์ดํ„ฐ์˜ variance๋ฅผ ์„ค๋ช…ํ•˜๊ธฐ ์œ„ํ•ด์„œ ๊ฐ๊ฐ์˜ Principal Component (eigen vector)์— ์„œ๋กœ ๋‹ค๋ฅธ ์ˆ˜(eigen value)๊ฐ€ ๊ณฑํ•ด์ง€๋Š”๋ฐ, ์ด eigen value๊ฐ€ ๊ฐ€์žฅ ํฐ Principal Component๋ถ€ํ„ฐ PC1, PC2,โ€ฆ ์ด๋ ‡๊ฒŒ ์ด๋ฆ„์„ ๋ถ™์ด๊ฒŒ ๋œ๋‹ค.

์„ค๋ช…ํ•˜๋‹ค ๋ณด๋‹ˆ ๊ณ„์† ๋น„์Šทํ•œ ์–˜๊ธฐ๋ฅผ ๋ฐ˜๋ณตํ•˜๋Š” ๊ฒƒ ๊ฐ™์€๋ฐ, ์‰ฌ์šด ์ดํ•ด๋ฅผ ์œ„ํ•ด์„œ ๋ฐ‘์— ๊ทธ๋ฆผ์„ ์ฐธ๊ณ ํ•˜๋ฉด ์ข‹์„ ๊ฒƒ ๊ฐ™๋‹ค๐Ÿ™‚๐Ÿ™‚.

๐Ÿงฉ ์œ„์˜ ๊ทธ๋ฆผ์—์„œ ํ™•์ธ ํ•  ์ˆ˜ ์žˆ๋“ฏ์ด

  • PC1๊ณผ PC2โ€ฆ ๋Š” ์„œ๋กœ orthogonal ํ•˜๋‹ค.
  • ์›๋ž˜ ๋ฐ์ดํ„ฐ๊ฐ€ Principal Component๋กœ ๋งŒ๋“ค์–ด์ง„ ์ขŒํ‘œํ‰๋ฉด์—์„œ ์ƒˆ๋กญ๊ฒŒ ํ‘œํ˜„๋œ๋‹ค.

โ—โ—โ— ์œ„์˜ ๊ทธ๋ฆผ์—์„œ ์›๋ณธ ๋ฐ์ดํ„ฐ์—์„œ๋Š” point๊ฐ€ ์—ฌ๋Ÿฌ๊ฐœ์ธ๋ฐ ์ƒˆ๋กœ์šด ํ‰๋ฉด์œผ๋กœ ์˜ฎ๊ฒผ์„๋•Œ ์ ์„ ํ•˜๋‚˜๋งŒ ๊ทธ๋ ค๋‘์—ˆ๋‹ค๊ณ  ํ•ด์„œ ์›๋ณธ ๋ฐ์ดํ„ฐ์˜ ์ ์ด ์ € ํ•˜๋‚˜์˜ ์ ์œผ๋กœ ํ‘œํ˜„๋˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋‹ค!! ๊ทธ๋ƒฅ ๋‹จ์ˆœํžˆ ๋‚˜์™€ ์ด ๊ธ€์„ ์ฝ๋Š” ์‚ฌ๋žŒ๋“ค์ด ๋ณด๋‹ค ์ž˜ ๋ณผ ์ˆ˜ ์žˆ๋„๋ก ์ €๋ ‡๊ฒŒ ํ‘œํ˜„ํ•œ ๊ฒƒ์ด๋‹ค๐Ÿ™ƒ๐Ÿ™ƒ.

๐Ÿšฉ ์•ž์„œ ์„ค๋ช…ํ–ˆ๋“ฏ์ด ์›๋ž˜ ๋ฐ์ดํ„ฐ์˜ variance๋ฅผ ์ž˜ ์„ค๋ช…ํ•˜๋Š” ์ •๋„๋ฅผ ๊ธฐ์ค€์œผ๋กœ Principal Component์˜ ๋„˜๋ฒ„๋ง์„ ์ •์˜ํ•˜๋Š”๋ฐ, ์ด์— ๋”ฐ๋ผ ๋Œ€๋ถ€๋ถ„์˜ variance๊ฐ€ PC1๊ณผ PC2๋งŒ ๊ฐ€์ง€๊ณ ์„œ ์„ค๋ช…์ด ๊ฐ€๋Šฅํ•˜๋‹ค. ์ด๋•Œ PC1๊ณผ PC2๋งŒ์„ ๊ฐ€์ง€๊ณ  ์„ค๋ช…์ด ๋˜์ง€ ์•Š์€ ๊ฒฝ์šฐ์—๋Š” PC3,PC4โ€ฆ ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋œ๋‹ค. ๋˜ํ•œ, ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ์„ค๋ช… ์ •๋„๊ฐ€ ๋‚˜์˜ฌ๋•Œ๊นŒ์ง€ Principal Component๋ฅผ ์„ ํƒํ•˜๊ณ  ํ•ฉ์น˜๋Š” ๊ฒƒ๋„ ๊ฐ€๋Šฅํ•˜๋‹ค. ์ด์™€ ๊ด€๋ จ๋œ ๋‚ด์šฉ์€ ์ง€๋‚œ ํ•™๊ธฐ์— ์ง„ํ–‰ํ•œ (์˜ํ˜ผ์„ ๊ฐˆ์•„ ๋„ฃ์€) ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹ ํ”„๋กœ์ ํŠธ๋ฅผ ํ†ตํ•ด ๋‹ค์Œ ํฌ์ŠคํŒ…์—์„œ ์„ค๋ช…ํ•  ์ƒ๊ฐ์ด๋‹ค๐Ÿ™„.

๐Ÿšฉ ์•ž์„œ PCA๋ฅผ ํ†ตํ•ด ์›๋ž˜ attribute๋ฅผ combineํ•˜๋Š” ๊ณผ์ •์—์„œ ๋ฐ์ดํ„ฐ์˜ dimension์ด ์ค„์–ด๋“ ๋‹ค๊ณ  ์„ค๋ช…ํ–ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด์— ๋”ํ•ด์„œ PCA๋Š” ๋‘๋ฒˆ์งธ๋กœ ๊ทธ dimension์„ ์ค„์ผ ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„์ด ์žˆ๋‹ค. ๋ฐ”๋กœ Principal Component๋ฅผ ์„ ํƒํ•˜๋Š” ๋ถ€๋ถ„์ด๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ์ •๋„๊นŒ์ง€๋งŒ variance๋ฅผ ์„ค๋ช…ํ•˜๋ฉด ๋˜๊ณ , ์ด๋ฅผ ๋งŒ์กฑํ•˜๋Š” Principal Component๊นŒ์ง€๋งŒ ์„ ํƒํ•  ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์—, ์ด๋ฅผ ์„ ํƒํ•˜๋Š” ๊ณผ์ •์—์„œ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ Dimensionality Reduction์„ ํ•˜๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค.


๐Ÿงฉ ์ด๋ ‡๊ฒŒ ํ•ด์„œ PCA์— ๋Œ€ํ•ด์„œ ์ค‘์š”ํ•œ ๊ฐœ๋…์„ ๋‚˜๋ฆ„ ์ž์„ธํžˆ ์งš์–ด๋ณด์•˜๋‹ค. ์ด๋ฒˆ ํฌ์ŠคํŒ…์˜ ๋‚ด์šฉ์„ ์š”์•ฝํ•˜๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

  • ๊ธฐ์กด์˜ attributes๋ฅผ linear combinationํ•ด์„œ ์ƒˆ๋กœ์šด attributes๋ฅผ ๋งŒ๋“œ๋Š” ๊ฒƒ.
  • ๊ทธ๋ฆฌ๊ณ  ๊ทธ ์ƒˆ๋กœ์šด attributes๊ฐ€ ์ƒˆ๋กœ์šด ์ถ•์ธ principal component๋กœ ์ •์˜๋จ.
  • ๊ธฐ์กด์˜ ๋ฐ์ดํ„ฐ๋“ค์€ ์ƒˆ๋กœ์šด ์ถ• PC1, PC2โ€ฆ์—์„œ ์ƒˆ๋กœ์šด ์ขŒํ‘œ๋ฅผ ๊ฐ€์ง€๊ฒŒ ๋จ.

  • ์ƒˆ๋กœ์šด ์ถ•๋“ค์„ ๋งŒ๋“  ๋’ค์— ๊ทธ ์ถ•๋“ค์„ ๊ธฐ์ค€์œผ๋กœ ์›๋ž˜ ๋ฐ์ดํ„ฐ์˜ variance๋ฅผ ์ž˜ ์„ค๋ช…ํ•˜๋Š” ์ˆœ์„œ๋Œ€๋กœ ๋ฒˆํ˜ธ๋ฅผ ๋งค๊น€.
  • ๊ฐ๊ฐ์˜ ๋งŒ๋“ค์–ด์ง€๋Š” ์ƒˆ๋กœ์šด ์ถ•๋“ค์ธ Principal Component๋“ค ๋˜ํ•œ ์„œ๋กœ orthogonal ํ•ด์•ผํ•จ.
  • ๋Œ€๋ถ€๋ถ„์˜ variance๊ฐ€ PC1๊ณผ PC2๋งŒ ๊ฐ€์ง€๊ณ ์„œ ์„ค๋ช…์ด ๊ฐ€๋Šฅํ•จ.
  • ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ์„ค๋ช… ์ •๋„๊ฐ€ ๋‚˜์˜ฌ๋•Œ๊นŒ์ง€ Principal Component๋ฅผ ์„ ํƒํ•˜๊ณ  ํ•ฉ์น˜๋Š” ๊ฒƒ๋„ ๊ฐ€๋Šฅํ•จ.
  • ์ฆ‰, ๋ชจ๋“  ๋ณ€์ˆ˜๋“ค์„ ๊ฐ€์žฅ ์ž˜ ์„ค๋ช…ํ•˜๋Š” ์ฃผ์„ฑ๋ถ„์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ•
  • ์›ํ•˜๋Š” ์ •๋„๊นŒ์ง€๋งŒ variance๋ฅผ ์„ค๋ช…ํ•˜๋ฉด ๋˜๊ณ , ์ด๋ฅผ ๋งŒ์กฑํ•˜๋Š” Principal Component๊นŒ์ง€๋งŒ ์„ ํƒํ•  ๊ฒƒ์ด๋ฏ€๋กœ, ์„ ํƒ๊ณผ์ •์—์„œ Dimensionality Reduction.

๐Ÿงฉ ์‹ค์ œ๋กœ PCA์— ๊ด€๋ จ๋œ ์—ฐ์‚ฐ์€ ์šฐ๋ฆฌ์˜ ์†Œ์ค‘ํ•œ ์ปดํ“จํ„ฐ๊ฐ€ ํ•ด์ค„ ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์—, ์ด๋ฒˆ์— ๋ฐฐ์šด ๊ฐœ๋…๋“ค๋งŒ ์•„์ฃผ ์†Œ์ค‘ํžˆ ๋จธ๋ฆฌ์— ๊ฐ„์งํ•ด๋„ PCA๊ฐ€ ๋ฌด์—‡์ด๋ƒ๋Š” ์งˆ๋ฌธ์— ๋‹นํ™ฉํ•˜์ง€ ์•Š๊ณ  ๋Œ€๋‹ตํ•  ์ˆ˜ ์žˆ์„ ๊ฑฐ๋ผ๊ณ  ์ƒ๊ฐํ•œ๋‹ค๐Ÿ™‚!!

๐Ÿงฉ ๋‹ค์Œ ํฌ์ŠคํŒ…์—์„œ๋Š” ์‹ค์ œ๋กœ PCA๋ฅผ ํ•˜๋Š” ๊ณผ์ •๊ณผ ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณด๋„๋ก ํ•˜์ž๐Ÿƒโ€โ™‚๏ธ๐Ÿƒโ€โ™‚๏ธ๐Ÿƒโ€โ™‚๏ธ.


๐Ÿ’ก์œ„ ํฌ์ŠคํŒ…์€ ํ•œ๊ตญ์™ธ๊ตญ์–ด๋Œ€ํ•™๊ต ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ๊ณตํ•™๋ถ€ ๊ณ ์œคํฌ ๊ต์ˆ˜๋‹˜์˜ [์ƒ๋ช…์ •๋ณดํ•™์„ ์œ„ํ•œ ๋ฐ์ดํ„ฐ๋งˆ์ด๋‹] ๊ฐ•์˜ ๋‚ด์šฉ์„ ๋ฐ”ํƒ•์œผ๋กœ ํ•จ์„ ๋ฐํž™๋‹ˆ๋‹ค.

Leave a comment