SMALL
์ฐ๊ด๋ถ์
- ์ ํ๋ณ ๊ฑฐ๋ ๋น๋ํ๋ฅผ ํตํด ๊ท์น์ ์ฐพ๋๋ฐ์ ์์ํจ
- ์์ฐจ ์ฐ๊ด๋ถ์์ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ด๋ค ์๋นํํ๋ฅผ ๋ณด์ด๋๊ฐ์ ๋ํ ๋ถ์์ผ๋ก
์์ธ๊ณผ ๊ฒฐ๊ณผ์ ํํ๋ก ํด์์ด ๊ฐ๋ฅํด์ ๊ฒฐ๊ณผ๊ฐ ๋ ์ ์ฉํ๊ฒ ์ฐ์
์ฐ๊ด๊ท์น(Association Rule)
- ์กฐ๊ฑด๊ณผ ๋ฐ์์ ํํ(if-then)๋ก ๊ฒฐ๊ณผ ์ดํด ์ฌ์
- ๋ชฉ์ ๋ณ์๊ฐ ์์ด ๋ถ์ ๋ฐฉํฅ์ด๋ ๋ชฉ์ ์์ด๋ ์ ์ฉ ๊ฐ๋ฅํจ
- ๋๋ฌด ์ธ๋ถํ๋ ํ๋ชฉ์ ์๋ฏธ์๋ ๊ฒฐ๊ณผ๋ฅผ ๋์ถํจ
- ์ค์๊ฐ ์ํ์ถ์ฒ์ ํตํ ๊ต์ฐจํ๋งค ๋ฑ์ ํ์ฉ ๊ฐ๋ฅํจ
์ฅ์
- ๋ถ์ ๋ฐฉํฅ์ด๋ ๋ชฉ์ ์ด ํน๋ณํ ์๋ ๊ฒฝ์ฐ ๋ชฉ์ ๋ณ์๊ฐ ์์ผ๋ฏ๋ก ์ ์ฉํจ
- ๊ฑฐ๋ ๋ด์ฉ์ ๋ํ ๋ฐ์ดํฐ๋ฅผ ๋ณํ ์์ด ๊ทธ ์์ฒด๋ก ์ด์ฉํ ์ ์๋ ๊ฐ๋จํ ์๋ฃ๊ตฌ์กฐ๋ฅผ ๊ฐ๋ ๋ถ์ ๋ฐฉ๋ฒ์
- ๊ณ์ฐ์ด ๊ฐ๋จํจ
- ๊ฒฐ๊ณผ์ดํด ์ฌ์
๋จ์
- ํ๋ชฉ ์๊ฐ ์ฆ๊ฐํ๋ฉด ๋ถ์์ ํ์ํ ๊ณ์ฐ์ด ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐํจ
- ๊ฑฐ๋๋์ด ์ ์ ํ๋ชฉ์ ๋น์ฐํ ๊ท์น ๋ฐ๊ฒฌ์ ์ ์ธ๋๊ธฐ ์ฌ์
- ์ฐ๊ด๋ถ์ ๊ฒฐ๊ณผ๋ก๋ ํ๋ชฉ ๊ฐ ๊ตฌ์ฒด์ ์ธ ์ํฅ์ ์ ์ ์์
์ฐ๊ด๊ท์น์ ์ธก๋
- ์ง์ง๋(Support): ์ ์ฒด ๊ฑฐ๋ ์ค ํ๋ชฉ A, B๋ฅผ ๋์์ ํฌํจํ๋ ๊ฑฐ๋์ ๋น์จ
= $\frac{P(A\cap B)}{P(ALL)}$ - ์ ๋ขฐ๋(Confidence): A๋ฅผ ํฌํจํ ๊ฑฐ๋ ์ค A, B๊ฐ ๊ฐ์ด ํฌํจ๋ ํ๋ฅ ์ ์ด๋ ์ ๋์ธ๊ฐ๋ฅผ ๋ํ๋ด์ฃผ๋ ์ฐ๊ด์ฑ์ ์ ๋
= $P(B|A) = \frac {์ง์ง๋}{P(A)}$ - ํฅ์๋(Lift): A๊ฐ ์ฃผ์ด์ง์ง ์์์ ๋ ํ๋ชฉ B์ ํ๋ฅ ์ ๋นํด A๊ฐ ์ฃผ์ด์ก์ ๋ ํ๋ชฉ B์ ํ๋ฅ ์ฆ๊ฐ ๋น์จ
= $A→B,\ \ \frac {P(B|A)}{P(B)} = \frac {P(A\cap B)}{P(A)P(B)} = \frac {์ ๋ขฐ๋}{P(B)}$
Apriori ์๊ณ ๋ฆฌ์ฆ
์ต์ ์ง์ง๋ ๋ณด๋ค ํฐ ๋ฐ๋ฐํญ๋ชฉ ์งํฉ์์ ๋์ ์ธก๋(์ ๋ขฐ๋, ํฅ์๋) ๊ฐ์ ๊ฐ๋ ์ฐ๊ด๊ท์น์ ๊ตฌํ๋ ๋ฐฉ๋ฒ
- ์ต์ ์ง์ง๋๋ฅผ ์ค์ ํ๊ณ
- ๊ฐ๋ณ ํ๋ชฉ ์ค ์ต์ ์ง์ง๋๊ฐ ๋๋ ๋ชจ๋ ํ๋ชฉ์ ์ฐพ์
- ๊ฐ๋ณ ํ๋ชฉ๋ง์ผ๋ก ์ต์ ์ง์ง๋๊ฐ ๋๋ 2๊ฐ์ง ํ๋ชฉ์ ์ฐพ๊ณ
- ์ด๊ฒ๋ค์ ๊ฒฐํฉํด 3๊ฐ์ง ํ๋ชฉ ์งํฉ์ ์ฐพ์ผ๋ฉฐ ๋ฐ๋ณตํด ๋น๋ฐํ๋ชฉ์งํฉ์ ์ฐพ์
- inspect( ): apriori( ) ํจ์๋ฅผ ํ์ฉํด ์์ฑํ ์ฐ๊ด๊ท์น์ ๋ณด๊ธฐ ์ํด ์ฌ์ฉํ๋ ํจ์
๋ฐ์ํ
LIST
'ADsP' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
ADsP 3๊ณผ๋ชฉ 5-5 ๊ตฐ์ง๋ถ์ | ์ ๋ฆฌ๐ (1) | 2024.10.01 |
---|---|
ADsP 3๊ณผ๋ชฉ 5-4 ์ธ๊ณต์ ๊ฒฝ๋ง ๋ถ์ | ์ ๋ฆฌ๐ (3) | 2024.09.30 |
ADsP 3๊ณผ๋ชฉ 5-3 ์์๋ธ ๋ถ์ | ์ ๋ฆฌ๐ (0) | 2024.09.27 |
ADsP 3๊ณผ๋ชฉ 5-2 ๋ถ๋ฅ๋ถ์ | ์ ๋ฆฌ๐ (2) | 2024.09.26 |
ADsP 3๊ณผ๋ชฉ 5-1 ๋ฐ์ดํฐ ๋ง์ด๋์ ๊ฐ์ | ์ ๋ฆฌ๐ (1) | 2024.09.25 |