ADsP

ADsP 3๊ณผ๋ชฉ 5-6 ์—ฐ๊ด€ ๋ถ„์„ | ์ •๋ฆฌ๐Ÿ“

studyrooom 2024. 10. 2. 17:10
SMALL

์—ฐ๊ด€๋ถ„์„

  • ์ œํ’ˆ๋ณ„ ๊ฑฐ๋ž˜ ๋นˆ๋„ํ‘œ๋ฅผ ํ†ตํ•ด ๊ทœ์น™์„ ์ฐพ๋Š”๋ฐ์„œ ์‹œ์ž‘ํ•จ
  • ์‹œ์ฐจ ์—ฐ๊ด€๋ถ„์„์€ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ์–ด๋–ค ์†Œ๋น„ํ˜•ํƒœ๋ฅผ ๋ณด์ด๋Š”๊ฐ€์— ๋Œ€ํ•œ ๋ถ„์„์œผ๋กœ
    ์›์ธ๊ณผ ๊ฒฐ๊ณผ์˜ ํ˜•ํƒœ๋กœ ํ•ด์„์ด ๊ฐ€๋Šฅํ•ด์„œ ๊ฒฐ๊ณผ๊ฐ€ ๋” ์œ ์šฉํ•˜๊ฒŒ ์“ฐ์ž„

 

์—ฐ๊ด€๊ทœ์น™(Association Rule)

  • ์กฐ๊ฑด๊ณผ ๋ฐ˜์‘์˜ ํ˜•ํƒœ(if-then)๋กœ ๊ฒฐ๊ณผ ์ดํ•ด ์‰ฌ์›€
  • ๋ชฉ์ ๋ณ€์ˆ˜๊ฐ€ ์—†์–ด ๋ถ„์„ ๋ฐฉํ–ฅ์ด๋‚˜ ๋ชฉ์  ์—†์ด๋„ ์ ์šฉ ๊ฐ€๋Šฅํ•จ
  • ๋„ˆ๋ฌด ์„ธ๋ถ„ํ™”๋œ ํ’ˆ๋ชฉ์€ ์˜๋ฏธ์—†๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋„์ถœํ•จ
  • ์‹ค์‹œ๊ฐ„ ์ƒํ’ˆ์ถ”์ฒœ์„ ํ†ตํ•œ ๊ต์ฐจํŒ๋งค ๋“ฑ์— ํ™œ์šฉ ๊ฐ€๋Šฅํ•จ

์žฅ์ 

  • ๋ถ„์„ ๋ฐฉํ–ฅ์ด๋‚˜ ๋ชฉ์ ์ด ํŠน๋ณ„ํžˆ ์—†๋Š” ๊ฒฝ์šฐ ๋ชฉ์ ๋ณ€์ˆ˜๊ฐ€ ์—†์œผ๋ฏ€๋กœ ์œ ์šฉํ•จ
  • ๊ฑฐ๋ž˜ ๋‚ด์šฉ์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ€ํ™˜ ์—†์ด ๊ทธ ์ž์ฒด๋กœ ์ด์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ„๋‹จํ•œ ์ž๋ฃŒ๊ตฌ์กฐ๋ฅผ ๊ฐ–๋Š” ๋ถ„์„ ๋ฐฉ๋ฒ•์ž„
  • ๊ณ„์‚ฐ์ด ๊ฐ„๋‹จํ•จ
  • ๊ฒฐ๊ณผ์ดํ•ด ์‰ฌ์›€

๋‹จ์ 

  • ํ’ˆ๋ชฉ ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•˜๋ฉด ๋ถ„์„์— ํ•„์š”ํ•œ ๊ณ„์‚ฐ์ด ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ์ฆ๊ฐ€ํ•จ
  • ๊ฑฐ๋ž˜๋Ÿ‰์ด ์ ์€ ํ’ˆ๋ชฉ์€ ๋‹น์—ฐํžˆ ๊ทœ์น™ ๋ฐœ๊ฒฌ์— ์ œ์™ธ๋˜๊ธฐ ์‰ฌ์›€
  • ์—ฐ๊ด€๋ถ„์„ ๊ฒฐ๊ณผ๋กœ๋Š” ํ’ˆ๋ชฉ ๊ฐ„ ๊ตฌ์ฒด์ ์ธ ์˜ํ–ฅ์„ ์•Œ ์ˆ˜ ์—†์Œ

 

์—ฐ๊ด€๊ทœ์น™์˜ ์ธก๋„

  • ์ง€์ง€๋„(Support): ์ „์ฒด ๊ฑฐ๋ž˜ ์ค‘ ํ’ˆ๋ชฉ A, B๋ฅผ ๋™์‹œ์— ํฌํ•จํ•˜๋Š” ๊ฑฐ๋ž˜์˜ ๋น„์œจ
    = $\frac{P(A\cap B)}{P(ALL)}$
  • ์‹ ๋ขฐ๋„(Confidence): A๋ฅผ ํฌํ•จํ•œ ๊ฑฐ๋ž˜ ์ค‘ A, B๊ฐ€ ๊ฐ™์ด ํฌํ•จ๋œ ํ™•๋ฅ ์€ ์–ด๋А ์ •๋„์ธ๊ฐ€๋ฅผ ๋‚˜ํƒ€๋‚ด์ฃผ๋Š” ์—ฐ๊ด€์„ฑ์˜ ์ •๋„
    = $P(B|A) = \frac {์ง€์ง€๋„}{P(A)}$
  • ํ–ฅ์ƒ๋„(Lift): A๊ฐ€ ์ฃผ์–ด์ง€์ง€ ์•Š์•˜์„ ๋•Œ ํ’ˆ๋ชฉ B์˜ ํ™•๋ฅ ์— ๋น„ํ•ด A๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ํ’ˆ๋ชฉ B์˜ ํ™•๋ฅ  ์ฆ๊ฐ€ ๋น„์œจ
    = $A→B,\ \ \frac {P(B|A)}{P(B)} = \frac {P(A\cap B)}{P(A)P(B)} = \frac {์‹ ๋ขฐ๋„}{P(B)}$

 

Apriori ์•Œ๊ณ ๋ฆฌ์ฆ˜

์ตœ์†Œ ์ง€์ง€๋„ ๋ณด๋‹ค ํฐ ๋ฐ˜๋ฐœํ•ญ๋ชฉ ์ง‘ํ•ฉ์—์„œ ๋†’์€ ์ธก๋„(์‹ ๋ขฐ๋„, ํ–ฅ์ƒ๋„) ๊ฐ’์„ ๊ฐ–๋Š” ์—ฐ๊ด€๊ทœ์น™์„ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•

  1. ์ตœ์†Œ ์ง€์ง€๋„๋ฅผ ์„ค์ •ํ•˜๊ณ 
  2. ๊ฐœ๋ณ„ ํ’ˆ๋ชฉ ์ค‘ ์ตœ์†Œ ์ง€์ง€๋„๊ฐ€ ๋„˜๋Š” ๋ชจ๋“  ํ’ˆ๋ชฉ์„ ์ฐพ์Œ
  3. ๊ฐœ๋ณ„ ํ’ˆ๋ชฉ๋งŒ์œผ๋กœ ์ตœ์†Œ ์ง€์ง€๋„๊ฐ€ ๋„˜๋Š” 2๊ฐ€์ง€ ํ’ˆ๋ชฉ์„ ์ฐพ๊ณ 
  4. ์ด๊ฒƒ๋“ค์„ ๊ฒฐํ•ฉํ•ด 3๊ฐ€์ง€ ํ’ˆ๋ชฉ ์ง‘ํ•ฉ์„ ์ฐพ์œผ๋ฉฐ ๋ฐ˜๋ณตํ•ด ๋นˆ๋ฐœํ’ˆ๋ชฉ์ง‘ํ•ฉ์„ ์ฐพ์Œ
  • inspect( ): apriori( ) ํ•จ์ˆ˜๋ฅผ ํ™œ์šฉํ•ด ์ƒ์„ฑํ•œ ์—ฐ๊ด€๊ทœ์น™์„ ๋ณด๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉํ•˜๋Š” ํ•จ์ˆ˜
๋ฐ˜์‘ํ˜•
LIST