SMALL
๊ธฐ์ ํต๊ณ: ๋ฐ์ดํฐ์ ํน์ง์ ์์น์ ์ผ๋ก ์ ๋ฆฌ/์์ฝํ๋ ๋ฐฉ๋ฒ๋ก
- ํต๊ณ๋
- ์ค์ฌ: ํ๊ท , ์ค์์, ์ต๋น๊ฐ
- ์ฐํฌ๋: ๋ถ์ฐ, ํ์คํธ์ฐจ, ๋ฒ์, ์ฌ๋ถ์์ ๋ฒ์(IQR)
ํต๊ณ ๊ฐ๋
- ํ๊ท : ๋ชจ๋ ์๋ฃ์ ๊ฐ์ ๋ํ์ฌ ์๋ฃ์ ์๋ก ๋๋์ด ์ค ๊ฐ
์ด์์น์ ์ํฅ์ด ํผ - ์ค์๊ฐ: ํฌ๊ธฐ์์ ์๋ฃ์์ ๊ฐ์ด๋ฐ์ ์์นํ๋ ๊ฐ
- ๋ถ์ฐ: ํธ์ฐจ ์ ๊ณฑ์ ํฉ์ ์๋ฃ์ ์๋ก ๋๋ ๊ฐ (ํผ์ง์ ์ ๋)
- ํ์คํธ์ฐจ: ๋ถ์ฐ์ ์ ๊ณฑ๊ทผ ํ ๊ฐ
- ์๋: ๋ถํฌ์ ๋น๋์นญ๋
- ์ฒจ๋: ๋พฐ์กฑํ ์ ๋ (ํ์ค์ ๊ท๋ถํฌ์ ์ฒจ๋๋ 3)
- p-๋ฐฑ๋ถ์์: ์ ์ฒด ์๋ฃ๋ฅผ ํฌ๊ธฐ ์์๋๋ก ๋์ดํ์ ๋, ๋ฐฑ๋ถ์จ๋ก ํ์๋ ์์น์ ํด๋นํ๋ ๊ฐ
- ์๊ด: ํ๋ฅ ๋ณ์ $X, Y$์ ๋ณํ๊ฐ ์๋ก ๊ด๊ณ๊ฐ ์์ ๋ ์๊ด๊ด๊ณ๊ฐ ์๋ค๊ณ ํจ(์ ํ์ ๊ด๋ จ์ฑ)
- ๊ณต๋ถ์ฐ: ๋ ํ๋ฅ ๋ณ์ $X, Y$์ ์ ํ์ ์๊ด ์ ๋
๋ฐ์ดํฐ ๋จ์์ ์ํฅ์ ๋ง์ด ๋ฐ์ - ์๊ด๊ณ์: ๊ณต๋ถ์ฐ์ ๋ ๋ณ์ ํ์คํธ์ฐจ์ ๊ณฑ์ผ๋ก ๋๋์ด ๋จ์๋ฅผ ์ ๊ฑฐํ ๊ฐ
(-1, 1) ๋ฒ์ ์์ ๊ฐ์ด ์กด์ฌํจ
- ๊ณต๋ถ์ฐ: ๋ ํ๋ฅ ๋ณ์ $X, Y$์ ์ ํ์ ์๊ด ์ ๋
์๋ฃ์ ํํ
- ๋ํ๋ ๊ทธ๋ํ๋ฅผ ๋ง๋ฆ
- ๊ทธ๋ํํํ ์๋ฃ์ ๋์นญ์ฑ์ ๋น๋กฏํ ์ ๋ฐ์ ์ธ ํํ๋ฅผ ๊ด์ฐฐ
- ๊ทธ๋ํ์์ ์ผ๋ฐ์ ์ธ ๋ถํฌ์ ๋ค๋ฅธ ์ด์์น๋ฅผ ๊ด์ฐฐ
- ๋ฒ์ฃผํ ์๋ฃ
- ๋ง๋๊ทธ๋ํ
- ๋์๋ถํฌํ
- ๋์: ๊ฐ ๋ฒ์ฃผ์ ์ํ๋ ๊ด์ธก๊ฐ์ ๊ฐ์
- ์๋๋์: ๋์๋ฅผ ์ ์ฒด ๊ฐ์๋ก ๋๋ ๋น์จ
$n$๋ฒ ๋ฐ๋ณต์ํ์์ ์ฌ๊ฑด $A$๊ฐ ์ผ์ด๋ ํ์๋ฅผ $r$ ์ด๋ผ ํ๋ฉด, ์๋๋์ $r/n$ ์ $n$ ์ด ์ปค์ง์ ๋ฐ๋ผ ํ๋ฅ $P(A)$ ์ ๊ฐ๊น์์ง
- ์ฐ์ํ ์๋ฃ
- ํ์คํ ๊ทธ๋จ: ์๋ฃ๊ฐ ์กด์ฌํ๋ ๋ฒ์๋ฅผ ๋ช ๊ฐ์ ๊ตฌ๊ฐ์ผ๋ก ๋๋์ด ๊ฐ ๊ตฌ๊ฐ์ ๋ค์ด์๋ ์๋ฃ์ ๋ฐ์ ๋์๋ฅผ ์ฒดํฌํ์ฌ ๋ง๋๊ทธ๋ํ๋ก ์์ฑํ ๊ทธ๋ฆผ (๋ถํฌ์ ํํ ํ์
)
ํ๋ก ๋์ด ์๋ ๋์๋ถํฌํ๋ฅผ ๊ทธ๋ํ๋ก ๋ํ๋ธ ๊ฒ- ์๋ฃ์ ์ค์ฌ/์ฐํฌ ๋ฑ์ ํ์
- ๋ฐ์ดํฐ ์๊ฐ ์ ์ด๋ 50๊ฐ ์ด์์ด์ด์ผ ํจ
- ๊ทธ๋ํ์ ๋ง๋ ์์ ๋ง๋์ ๊ตฌ๊ฐ์ ๋ฐ๋ผ ํ์์ด ๋ฌ๋ผ์ง
๋ด์ฐ๋ฆฌ๊ฐ ์ฌ๋ฌ๊ฐ ์๋ ๋ฐ์ดํฐ๋ ์ผ๋ฐ์ ์ผ๋ก 2๊ฐ ์ด์์ ๊ณต์ ์ด๋ ์กฐ๊ฑด์์ ๋ฐ์ดํฐ๊ฐ ์์ง๋๋ ๊ฒฝ์ฐ ๋ฐ์ํจ ๋๋ํ: ์ธ๋ด ๋ฐ์ดํฐ๊ฐ ๋ํ๋๋ ๊ฒ
- ์ค๊ธฐ-์-ํ๋กฏ(๊ทธ๋ํ): ์๋ฃ๋ฅผ ์๊ณผ ์ค๊ธฐ๋ก ๊ตฌ๋ถ
- ํ์คํ ๊ทธ๋จ์ ๋นํด ์ ๋ณด ์์ค๋์ด ์ ์
- ์ฅ์ : Raw Data์ ์ ๋ณด๋ฅผ ๊ทธ๋๋ก ์ ์ง. ์ ๋ฐ์ ์ธ ๋ถํฌ ํํ๋ฅผ ํ์
- ๋จ์ : ๋ฐ์ดํฐ ์๊ฐ ๋ง์ผ๋ฉด ์คํ๋ ค ๋ถํธ
- ๋ฐ์ค-ํ๋กฏ(Box-plot): ๋ค์ฏ ์์น ์์ฝ(์ต์๊ฐ, 1์ฌ๋ถ์์, ์ค์๊ฐ, 3์ฌ๋ถ์์, ์ต๋๊ฐ)
- ๋ถํฌ์ ๋ํ ์์ฝ ์ ๋ณด๋ง์ ์ ๊ณต
- ๋ฐ์ดํฐ ์๊ฐ ์ ์ ๋ ๋ฎ์ ํจ์ฉ์ฑ
- ์ด์์น ์๋ณ ์ฌ์
- ํ์คํ ๊ทธ๋จ: ์๋ฃ๊ฐ ์กด์ฌํ๋ ๋ฒ์๋ฅผ ๋ช ๊ฐ์ ๊ตฌ๊ฐ์ผ๋ก ๋๋์ด ๊ฐ ๊ตฌ๊ฐ์ ๋ค์ด์๋ ์๋ฃ์ ๋ฐ์ ๋์๋ฅผ ์ฒดํฌํ์ฌ ๋ง๋๊ทธ๋ํ๋ก ์์ฑํ ๊ทธ๋ฆผ (๋ถํฌ์ ํํ ํ์
)
+) ํ๋ ํ ๊ทธ๋ฆผ(pareto diagram): ๋ช ๋ชฉํ ์๋ฃ์์ ์ค์ํ ์์๋ฅผ ์ฐพ๋ ๋ฐ ์ ์ฉํ ๋ฐฉ๋ฒ
์๋ฃ์ ์๊ด
- ์ฐ์ ๋: ๋ ๋ณ์ $X, Y$๊ฐ ์ง์ ์ด๋ค ๊ด์ธก๋ $n$๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์ขํ์์ ์ ์ผ๋ก ํํํ ๊ทธ๋ํ
- ๋ ํน์ฑ์ ๊ฐ์ด ์ฐ์์ธ ๊ฒฝ์ฐ, ํ๋ณธ์๋ฃ๋ฅผ ๊ทธ๋ํ๋ก ๋ํ๋ด๋ ๋ฐฉ๋ฒ
- ์ ์ฒด์ ์ธ ๋ณ์ ์ฌ์ด์ ๊ด๊ณ ์ ํ๊ณผ ํน์ด์ ์ ์ดํด๋ณผ ์ ์์
- ์๊ด(Correlation): ํ๋ฅ ๋ณ์ $X$์ ๋ณํ๊ฐ $Y$์ ๋ณํ์ ๊ด๊ณ๊ฐ ์์ ๋ ์๊ด๊ด๊ณ๊ฐ ์๋ค๊ณ ๋งํ๋ฉฐ, ์ด๋ฌํ ๋ถ์์ ์๊ด๋ถ์์ด๋ผ๊ณ ํจ
- ์๊ด๋ถ์: pca = princomp(data, cor = True)
- True: ์๊ด๊ด๊ณ ํ๋ ฌ
- False: ๊ณต๋ถ์ฐ ํ๋ ฌ
- ์๊ด๋ถ์: pca = princomp(data, cor = True)
- ์ ํ์ ์ธ ๊ด๋ จ์ฑ์ ๋ํ ๋ถ์
๊ณต๋ถ์ฐ๊ณผ ์๊ด๊ณ์
- ๊ณต๋ถ์ฐ: ์ธก์ ๋จ์์ ์์กด
- ์๊ด๊ณ์: ๋จ์ ์์. ํญ์ -1๊ณผ 1 ์ฌ์ด์ ๊ฐ
์ ๋๊ฐ 1์ ๊ฐ๊น์ธ ์๋ก ์๊ด์ฑ์ ๊ฐ๋๊ฐ ํผ (0์ ์๊ด๊ด๊ณX)- ํผ์ด์จ ์๊ด๊ณ์: ๊ณต๋ถ์ฐ์ ๋ ๋ณ์ ํ์คํธ์ฐจ์ ๊ณฑ์ผ๋ก ๋๋ ๊ฐ
- ์ ํ์ ์๊ด๊ด๊ณ
- ๋ ์ ๋์ ๋ณ์ ๊ฐ ์ ํ์ ์ฐ๊ด์ฑ์ ๊ฐ๋๋ฅผ ์ฌ๋ ์ฒ๋
- ์คํผ์ด๋ง ์๊ด๊ณ์ / ์ผ๋ฌ ์๊ด๊ณ์
- ๋น์ ํ์ ์๊ด๊ด๊ณ
- ์๋ฃ์ ๊ฐ ๋์ ์์๋ฅผ ์ฌ์ฉํ์ฌ ๊ณ์ฐํ๋ ์๊ด๊ณ์
- ์ฐ์ํ ์๋ฃ๋ฅผ ์์ ๊ฒ๋ถํฐ ์์๋ฅผ ๋งค๊ฒจ ์์ด ์์๋ก ๋ฐ๊พผ ๋ค ์์๋ฅผ ์ด์ฉํด ํผ์ด์จ ์๊ด๊ณ์๋ฅผ ์ด์ฉํ๋ ๋ฐฉ๋ฒ
- ๋ฐ์ดํฐ ๋ด ์ด์์น๊ฐ ์์ ๋ ํ์ฉ
- ํผ์ด์จ ์๊ด๊ณ์: ๊ณต๋ถ์ฐ์ ๋ ๋ณ์ ํ์คํธ์ฐจ์ ๊ณฑ์ผ๋ก ๋๋ ๊ฐ
์๊ด๊ด๊ณ(๋ ํ์์ ๊ด๊ณ) → ์๊ด๊ด๊ณ ๋ถ์
์ธ๊ณผ๊ด๊ณ(์์ธ๊ณผ ๊ฒฐ๊ณผ ์ฌ์ด ๊ด๊ณ) → ํ๊ท๋ถ์
๋ฐ์ํ
LIST
'ADsP' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
ADsP 3๊ณผ๋ชฉ 4-4 ์๊ณ์ด ๋ถ์ | ์ ๋ฆฌ๐ (2) | 2024.09.20 |
---|---|
ADsP 3๊ณผ๋ชฉ 4-3 ํ๊ท๋ถ์ | ์ ๋ฆฌ๐ (1) | 2024.09.19 |
ADsP 3๊ณผ๋ชฉ 4-1 ํต๊ณ๋ถ์์ ์ดํด | ์ ๋ฆฌ๐ (1) | 2024.09.17 |
ADsP 3๊ณผ๋ชฉ 3-2 ๊ธฐ์ด ๋ถ์ ๋ฐ ๋ฐ์ดํฐ ๊ด๋ฆฌ | ์ ๋ฆฌ๐ (1) | 2024.09.16 |
ADsP 3๊ณผ๋ชฉ 3-1 ๋ฐ์ดํฐ ๋ณ๊ฒฝ ๋ฐ ์์ฝ | ์ ๋ฆฌ๐ (1) | 2024.09.13 |