3-4 ๊ณผ๋ชฉ์ ๋ค ์ค์ํด์ ํฌ์ธํธ๋ฅผ ๋ฑ ์ง๊ธฐ๊ฐ ์ด๋ ต๋ค์
๊ธฐ์ถ ๋ง์ด ๋๋ ค๊ฐ๋ฉด์ ๊ฐ ์ตํ๋ ๊ฒ ์ค์ํ ๊ฑฐ ๊ฐ์์
1. ํต๊ณ๋ถ์์ ์ดํด
ํต๊ณ: ๋ถ์ํ๊ณ ์ ํ๋ ์ง๋จ์ ๋ํด์ ์กฐ์ฌํ๊ฑฐ๋ ์คํ์ ํตํด์ ์ป๋ ์๋ฃ ๋๋ ์ด์ ์์ฝ๋ ํํ๋ฅผ ๋งํจ
ํต๊ณ ๋ฐ์ดํฐ ์์ง ๋ฐฉ๋ฒ
- ์ด/์ ์ ์กฐ์ฌ: ์กฐ์ฌ ๋์์ ์ง๋จ์ ๋ชจ๋ ์กฐ์ฌํ๋ ๋ฐฉ๋ฒ๋ก ์ผ๋ก, ์๊ฐ๊ณผ ๋น์ฉ ์์๊ฐ ํผ(์ธ๊ตฌ์ฃผํ ์ด์กฐ์ฌ)
- ํ๋ณธ ์กฐ์ฌ: ์กฐ์ฌ ๋์์ ์ผ๋ถ๋ง ์ธก์ ๋ฐฉ๋ฒ์ ์ํด ์ถ์ถํ์ฌ ์กฐ์ฌํ๋ ๋ฐฉ๋ฒ๋ก ํ๋ณธ ํฌ๊ธฐ๊ฐ ํด์๋ก ๋์ฒด๋ก ์ข์
- ํ๋ณธ์ค์ฐจ: ๋ชจ์ง๋จ ์ ์ฒด์ ํน์ฑ์ ์ถ๋ก ํจ์ผ๋ก์จ ์๊ธฐ๋ ์ค์ฐจ, ๋ชจ์ง๋จ์ ๋ํํ ์ ์๋ ํ๋ณธ๋จ์๋ค์ด ์กฐ์ฌ๋์์ผ๋ก ์ถ์ถ๋์ง ๋ชปํ๋ฉด ๋ฐ์
- ๋นํ๋ณธ์ค์ฐจ: ํ๋ณธ์ค์ฐจ๋ฅผ ์ ์ธํ ์กฐ์ฌ ๊ณผ์ ์ ์ฒด์์ ๋ฐ์ํ๋ ์ค์ฐจ
- ํ๋ณธํธ์: ํ๋ณธ์ถ์ถ ๋ฐฉ๋ฒ์์ ๊ธฐ์ธํ๋ ์ค์ฐจ
์ถ์ถ ๊ณผ์ ์์ ํน์ ๋์์ด ๋ค๋ฅธ ๋์์ ๋นํด ์ฐ์ ์ ์ผ๋ก ์ถ์ถ๋ ๋ ์๊ธฐ๋ ์ค์ฐจ
ํ๋ณธ์กฐ์ฌ: ๋ชจ์ง๋จ์ ๋ํํ ์ ์๋ ํ๋ณธ์ง๋จ์ ์ ๋ณํ์ฌ ์กฐ์ฌํ ๊ฒ.
๋ํ์ฑ์ ์ ๋ขฐํ ์ ์์ด์ผ ํต๊ณ๋ถ์์ ๊ฒฐ๊ณผ ๋ํ ์ ๋ขฐํ ์ ์์
- ๋ชจ์ง๋จ(population): ๊ด์ฌ/์กฐ์ฌ์ ๋์์ด ๋๋ ๊ฐ์ฒด์ ์ ์ฒด ์งํฉ
- ๋ชจ์(Parameter): ๋ชจ์ง๋จ์ ๋ํ ์์น์ ์์ฝ
- ํ๋ณธ(Sample): ๋ชจ์ง๋จ์ ์ ์ ํ ๋ํํ๋ ๋ชจ์ง๋จ์ ์ผ๋ถ
- ํต๊ณ๋(Statistic): ํ๋ณธ์ ๋ํ ์์น์ ์์ฝ
ํ๋ณธ ์ถ์ถ ๋ฐฉ๋ฒ 4๊ฐ์ง
- ๋จ์ ๋๋ค ์ถ์ถ๋ฒ
๋ฌด์์ ์ถ์ถ
์ถ์ถ ํ๋ฅ ๋์ผ - ๊ณํต ์ถ์ถ๋ฒ
๋ชจ์ง๋จ์ ํฌ๊ธฐ๋ฅผ ์ํ๋ ํ๋ณธ ํฌ๊ธฐ๋ก ๋๋์ด ์ถ์ถ ๊ฐ๊ฒฉ์ ์ ํ๊ณ ์ฒซ ๋ฒ์งธ ์ถ์ถํ ๊ฐ์ฒด๋ฅผ ์์๋ก ์ ํ ํ ์ฌ์ ์ ์ ์ํ ๊ฐ๊ฒฉ๋ณ๋ก ๊ฐ์ฒด๋ฅผ ์ถ์ถํ๋ ๋ฐฉ๋ฒ๋ก - ์ธตํ ํ๋ณธ ์ถ์ถ๋ฒ
๋ชจ์ง๋จ์ ๋ช ๊ฐ์ ์ธต์ผ๋ก ๋๋์ด ๊ฐ ์ธต์์ ๋จ์๋๋ค์ถ์ถ์ ํ๋ ๋ฐฉ๋ฒ
์ด์ง์ ์ธ ์์๋ค๋ก ๊ตฌ์ฑ๋ ๋ชจ์ง๋จ์์ ๊ฐ ๊ณ์ธต์ ๊ณ ๋ฃจ ๋ํํ ์ ์๋๋ก ํ๋ณธ์ ์ถ์ถํจ
์๋ก ์ ์ฌํ ๊ฒ๋ผ๋ฆฌ ๋ช ๊ฐ์ ์ธต์ ๋๋ ํ, ๊ฐ ๊ณ์ธต์์ ํ๋ณธ์ ๋๋คํ๊ฒ ์ถ์ถํจ- ๋น๋ก ์ธตํ ์ถ์ถ๋ฒ: ๊ฐ ์ง๋จ์ ํฌ๊ธฐ, ๋ถ์ฐ์ ๊ณ ๋ คํด ๊ฐ ์ง๋จ๋ง๋ค ์ํ์ ์ถ์ถํจ
- ์ง๋ฝ(๊ตฐ์ง: Cluster)์ถ์ถ๋ฒ (≠์ง๋จ ์ถ์ถ๋ฒ)
ํ๋ณธ์ถ์ถ๋จ์๊ฐ ๊ฐ์ฒด๊ฐ ์๋, ๊ฐ์ฒด๊ฐ ๋ชจ์ธ ‘์ง๋จ’์ ๋ฌด์์๋ก ์ ํํ ํ ์ ํ๋ ์ง๋จ๋ค ๋ด์ ์๋ ๋ชจ๋ ๊ฐ์ฒด๋ฅผ ์ถ์ถํ๋ ๋ฐฉ๋ฒ๋ก → ๋ค๋จ๊ณ ์ถ์ถ ๋ฐฉ๋ฒ
๊ฐ ์ง๋ฝ๋ผ๋ฆฌ ๋์ง์ ์ด๊ณ ํ๋์ ์ง๋ฝ์ ๋ํด์๋ ์๋ก ๋ค๋ฅธ ์ฑ๊ฒฉ์ ๋ฐ์ดํฐ๋ค์ด ํฌํจ๋์ด ์ด์ง์ ์
์ธก์ ๋ฐฉ๋ฒ
๋ช ๋ชฉ์ฒ๋ | ์์ด ๊ด๊ณ๊ฐ ์๋ ๋ฒ์ฃผ๋ก ์ธก์ | ์ง์ญ. ํ์กํ, Godd/Bad/๋ชจ๋ฆ | ์ง์ |
์์์ฒ๋ | ์์ด ๊ด๊ณ๊ฐ ์๋ ๋ฒ์ฃผ๋ก ์ธก์ | ์๋ฅ์ธต/์ค์ฐ์ธต/ํ๋ฅ์ธต, ์ ํธ๋, ๋ง์กฑ๋ | ์ง์ |
๋ฑ๊ฐ(๊ตฌ๊ฐ)์ฒ๋ | ๋์์ ์์ฑ์ ๊ฐ๊ฒฉ์ด ๊ท ๋ฑํ๊ฒ ์ธก์ ๊ตฌ๊ฐ ์ฌ์ด ๊ฐ๊ฒฉ์ ์๋ฏธ๊ฐ ์๋ ์๋ฃ(์ฌ์น์ฐ์ฐX) |
์จ๋, ์ง์ | ์์ |
๋น์จ์ฒ๋ | ๋์์ ์์ฑ์ ๊ฐ๊ฒฉ์ด ๊ท ๋ฑํ๋ฉฐ ์ ๋๊ฐ์ด ์กด์ฌํ๊ฒ ์ธก์ 0์ด ์กด์ฌํ์ฌ ์ฌ์น์ฐ์ฐ์ด ๊ฐ๋ฅํ ์๋ฃ |
๊ฑฐ๋ฆฌ, ๋ฌด๊ฒ, ์ ์, ๋์ด | ์์ |
๋น์จ์ฒ๋: ๋ช ๋ชฉ์ฒ๋์ ๋นํด ๋ณ์๊ฐ ๋ดํฌํ๋ ์ ๋ณด์ ์์ด ๋ง๊ณ , ์๋ฃ ์ถ์ ์ ๋น์ฉ๊ณผ ๋ ธ๋ ฅ์ด ๋ง์ด ํ์ํจ
ํต๊ณ๋ถ์
- ๊ธฐ์ ํต๊ณ: ๋ฐ์ดํฐ์ ํน์ง์ ์์น์ ์ผ๋ก ์ ๋ฆฌ/์์ฝํ๋ ๋ฐฉ๋ฒ๋ก
ํ๋ณธ ์์ฒด์ ์์ฑ์ด๋ ํน์ง์ ํ์ ํ๋ ๋ฐ ์ค์ . ์กฐ์งํ, ๋จ์ํ
ex) ์ํ๊ตฐ๋ณ ์ ๋งค์ถ์ก ํ๊ท /์ค์์/ํ์คํธ์ฐจ
์๋ณ ์ฃผ๊ฐ์ง์ ์์ต๋ฅ ์ ํ๊ท - ์ถ๋ก (์ถ์ธก)ํต๊ณ: ๋ชจ์ง๋จ์ผ๋ก๋ถํฐ ์ถ์ถํ ํ๋ณธ์ ํต๊ณ๋์ ํ์ฉํ์ฌ ๋ชจ์์ ๋ํด ํต๊ณ์ ์ธ ์ถ๋ก (์์ธก)/๊ฒ์ ์ ํ๋ ๋ฐฉ๋ฒ๋ก
๋ชจ์ง๋จ์ ๋ณ๋์ฑ, ํผ์ง์ ์ ๋์ ๊ด์ฌ์ด ์๋ ๊ฒฝ์ฐ, ๋ชจ๋ถ์ฐ์ด ์ถ๋ก ์ ๋์์ด ๋จ
์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด์ง ์๋๋ผ๋ ์ค์ฌ๊ทนํ์ ๋ฆฌ๋ฅผ ํตํด ๋ชจ๋ถ์ฐ์ ๋ํ ๊ฒ์ ์ ์ ์ฌํ๊ฒ ์ํํ ์ ์์- ํต๊ณ์ ์ถ์ (๋ชจ์ ์ถ์ ): ํ๋ณธ์ ํต๊ณ๋์ ํตํด ๋ชจ์ง๋จ์ ๋ชจ์๋ฅผ ์ถ์
์ถ์ : ํ๋ณธ์ ์ด์ฉํด ๋ชจ์ง๋จ์ ํน์ฑ์น์ ๋ํ ์ถ์ธก๊ฐ์ ์ ๊ณตํ๊ณ ์ค์ฐจํ๊ณ๋ฅผ ์ ์ํ๋ ๊ณผ์
ํ๋ณธํต๊ณ๋์ ๊ธฐ์ดํ์ฌ ๋ชจ์์ ๊ทผ์ฌ๊ฐ์ ๊ฒฐ์ ํ๋ ๊ฒ์ด ๋ชฉ์ ์
ํ์ค์ค์ฐจ: ์ถ์ ๋ $\hat µ$์ ํ์คํธ์ฐจ์ธ $σ/\sqrt n$ (์ค์ฐจํ๊ณ์ ๊ธฐ๋ณธ) - ๊ฐ์ค ๊ฒ์ : ์ค์ ํ ๊ฐ์ค์ด ์ณ์ ๋ ํ๋ณธ์์ ํต๊ณ๋๊ณผ ํต๊ณ๋์ ๋ถํฌ์์ ์ด๋ก ์ ์ผ๋ก ์ป๋ ํน์ ๊ฐ์ ๋น๊ตํ์ฌ ๊ฐ์ค์ ๊ธฐ๊ฐ/์ฑํ ์ฌ๋ถ๋ฅผ ํ์
- ํ๋ฅ ์ ์ค์ฐจ ๋ฒ์๋ฅผ ๋์ด์๋ฉด ๊ฐ์ค ๊ธฐ๊ฐ
- ์ ์์์ค($α$): ๊ธฐ๊ฐ/์ฑํ ์ฌ๋ถ์ ํ๋จ ๊ธฐ์ค
1์์ ์ฃผ๊ฐ์ง์ ์์ต๋ฅ ์ด 7์๋ณด๋ค ํฐ๊ฐ?
- ํต๊ณ์ ์ถ์ (๋ชจ์ ์ถ์ ): ํ๋ณธ์ ํต๊ณ๋์ ํตํด ๋ชจ์ง๋จ์ ๋ชจ์๋ฅผ ์ถ์
ํ๋ฅ ๊ฐ๋
- ํ๋ฅ ๋ณ์
- ํ๋ณธ ๊ณต๊ฐ์์ ์ ์๋ ์ค์ซ๊ฐ ํจ์
์ค์๊ฐ ์๋๋ฉด ํ๋ฅ ๋ถํฌํจ์๋ฅผ ์ ์ํ ์ ์์ - ์ผ์ ํ๋ฅ ์ ๊ฐ์ง๊ณ ๋ฐ์ํ๋ ์ฌ๊ฑด์ ์์น๋ฅผ ๋ถ์ฌํ ๊ฒ
ex) ๋์ ์๋ฉด: 1 / ๋์ ๋ท๋ฉด: 0 - ๋ณ์๊ฐ ์ด๋ค ๊ฐ์ ์ทจํ๋์ง๊ฐ ํ๋ฅ ์ ์ผ๋ก ๊ฒฐ์ ๋จ
ํต๊ณ์ ๊ท์น์ฑ์ ์๋ค๊ณ ๋ด
- ํ๋ณธ ๊ณต๊ฐ์์ ์ ์๋ ์ค์ซ๊ฐ ํจ์
- ํ๋ฅ ๋ถํฌ
ํ๋ฅ ๋ณ์์ ๊ฐ๊ณผ ํ๋ฅ ์ ๋์์์ผ ํ, ๊ทธ๋ํ, ํจ์๋ก ํํํ ๊ฒ
ํ๋ฅ ๋ณ์๋ ์ฌ๊ฑด์ ์์น๋ฅผ ๋ถ์ฌํ ๊ฒ, ํ๋ฅ ๋ถํฌ๋ ์์น๋ฅผ ํ๋ฅ ๋ก ๋์์ํค๋ ๊ฒ
- ํ๋ณธ๊ณต๊ฐ($S$): ๋๋คํ ํ์์ ๋ชจ๋ ๊ฐ๋ฅํ ๊ฒฐ๊ณผ์ ์งํฉ
- ์ฌ๊ฑด(event): ํ๋ณธ๊ณต๊ฐ์ ๋ถ๋ถ์งํฉ
- ํฉ์ฌ์, ๊ณฑ์ฌ์, ์ฌ์ฌ์, ๋ฐฐ๋ฐ์ฌ์
ํ๋ฅ ์ ๊ณต๋ฆฌ์ ์ ์ : ํ๋ณธ๊ณต๊ฐ $S$์์์ ์์์ ์ฌ์ $A$์ ๋ํ์ฌ,
$0 ≤ P(A) ≤ 1$
$P(S) = 1$
ํ๋ฅ ๋ณ์์ ๊ธฐ๋๊ฐ: ํ๋ฅ ๋ณ์์ ์ด๋ก ์ ํ๊ท ๊ฐ
- ์ด์ฐํ๋ฅ ๋ณ์: $μ_x = E[X] = \sum_{i} x_i P(x_i)$
- ์ฐ์ํ๋ฅ ๋ณ์: $μ_x = E[X] = \int x P(x) dx$
1. ์ด์ฐ ํ๋ฅ ๋ณ์
์ด์ฐํ๋ณธ๊ณต๊ฐ์์ ์ ์๋ ํ๋ฅ ๋ณ์์ ๊ฐ์ด ์ ํ ํน์ countably infinite
*๊ฐ์ฐ ๋ฌดํ: ์
์ ์๋ ๋ฌดํ ์งํฉ(๋๊น์ง ์ธ์ง ๋ชปํ๋๋ผ๋ ์ธ๋ ํ์๊ฐ ๊ฐ๋ฅํ๋ฉด ๊ฐ์ฐ์)
ex) ์์ฐ์ ์ ์ฒด ์งํฉ
ํ๋ฅ ์ง๋ํจ์: ์ด์ฐ ํ๋ฅ ๋ณ์ $x$์ ๊ฐ $x_1, … , x_n$์ ๊ฐ ํ๋ฅ ์ ๋์
- ๋ฒ ๋ฅด๋์ด ๋ถํฌ: ํ๋ฅ ๋ณ์ $x$์ ๊ฐ์ด 2๊ฐ (0 or 1)
- ์ดํญ๋ถํฌ: ๋ฒ ๋ฅด๋์ด ์ํ์ $n$๋ฒ ๋ฐ๋ณตํ์ฌ ํน์ ํ ํ์์ ์ฑ๊ณต/์คํจ๊ฐ ๋ํ๋ ํ๋ฅ ์ ๋ถํฌ
- ๊ธฐํ๋ถํฌ: ๋ฒ ๋ฅด๋์ด ์ํ ์ค ์ฒ์์ผ๋ก ์ฑ๊ณต์ด ๋์ฌ ๋๊น์ง ํน์ ํ์ ์คํจํ ํ๋ฅ ์ ๋ถํฌ
- ๋คํญ๋ถํฌ: ์ดํญ๋ถํฌ์์ ํ๋ฅ ๋ณ์ $x$์ ๊ฐ์๊ฐ ์ฆ๊ฐํ ๊ฒ
์ดํญ๋ถํฌ → ๋คํญ๋ถํฌ($n_1, n_2, n_3, …$) - ํฌ์์ก ๋ถํฌ: ๋จ์ ์๊ฐ/๊ณต๊ฐ ๋ด ์ฌ๊ฑด์ ๋ฐ์ ํ์์ ํ๋ฅ ๋ถํฌ
2. ์ฐ์ ํ๋ฅ ๋ณ์
ํน์ ๊ตฌ๊ฐ ๋ด์ ๋ชจ๋ ๊ฐ์ ์ทจํ๋ ํ๋ฅ ๋ณ์
ํ๋ฅ ๋ณ์์ ๊ฐ์ด ๋ฌดํ๊ฐ์ด๋ฉฐ ์
์ ์์
ํ๋ฅ ๋ฐ๋ํจ์: ํ๋ฅ ๋ณ์ $x$๊ฐ ์ด๋ค ๊ตฌ๊ฐ$[l, u]$์ ๋ชจ๋ ๊ฐ์ ์ทจํจ
- ๊ท ๋ฑ๋ถํฌ(๊ท ์ผ๋ถํฌ, ์ผ์๋ถํฌ): ํ๋ฅ ๋ณ์ $x$์ ๋ชจ๋ ๊ฐ์ด ๊ฐ์ ํ๋ฅ ๋ฐ๋ ๊ฐ์ ๊ฐ์ง
- ์ ๊ท๋ถํฌ: ํ๋ณธ์ ํตํ ๋ชจ์ ์ถ์ , ๊ฐ์ค๊ฒ์ ์ ๊ธฐ๋ณธ
- ์ข์ฐ ๋์นญ(bell-shaped)
- ํ๊ท ์ ์ํด ๋ถํฌ์ ์์น๊ฐ ๊ฒฐ์ ๋จ
- ํ์คํธ์ฐจ์ ์ํด ๋ถํฌ์ ๋ชจ์์ด ๊ฒฐ์ ๋จ
- *ํ๊ท ๊ณผ ํ์คํธ์ฐจ๊ฐ ๋ชจ์
- ์ง์๋ถํฌ
- ์นด์ด์ ๊ณฑ ๋ถํฌ($x^2$-๋ถํฌ): ํ๋ณธ ๋ถ์ฐ์ ํตํ ๋ชจ๋ถ์ฐ ์ถ์ /๊ฒ์ ์ ์ฌ์ฉ๋๋ ๋ถํฌ
- ๋ชจํ๊ท ๊ณผ ๋ชจ๋ถ์ฐ์ ๋ชจ๋ฅด๋ ๋ ๊ฐ ์ด์ ์ง๋จ ๊ฐ ๋์ง์ฑ ๊ฒ์ ๋๋ ๋ชจ๋ถ์ฐ ๊ฒ์ ์ ์ํด ํ์ฉ๋จ
- ํ๋ณธ ๋ถ์ฐ์ ๋ถํฌ
- ์ค๋ฅธ์ชฝ ๊ผฌ๋ฆฌ๋ฅผ ๊ฐ์ง
- ํญ์ ์์ ๊ฐ
- ์์ ๋: $n-1$
- ์์ ๋๊ฐ ์ปค์ง๋ฉด ์ ๊ท๋ถํฌ์ ๊ฐ๊น์์ง
- F-๋ถํฌ: ๋ ๋ชจ๋ถ์ฐ์ ์ฐจ์ด์ ๋ํ ์ถ์ /๊ฒ์ ์ ์ด์ฉ
- ์นด์ด์ ๊ณฑ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ ํ๋ฅ ๋ณ์๋ฅผ ๊ฐ๊ฐ์ ์์ ๋๋ก ๋๋ ๊ฒ
- ๋ฑ๋ถ์ฐ ๊ฒ์ : ๋ ๋ชจ์ง๋จ์ ๋ํ์ฌ ๋ถ์ฐ์ด ๊ฐ์์ง ๋ค๋ฅธ์ง ๊ฒ์ ํ๊ธฐ ์ํ ๊ฐ์ค๊ฒ์
- t-๋ถํฌ: ๋ชจํ์คํธ์ฐจ๋ฅผ ๋ชจ๋ฅผ ๋, ๋ชจํ๊ท ์ ๋ํ ์ถ์ /๊ฒ์ ์ ์ฌ์ฉ๋จ
- ์์ ๋(df: degree of freedom) = n-1
- ์ ๊ท๋ถํฌ๋ณด๋ค ๋ ๋๊ฒ ํผ์ ธ์๊ณ ๊ผฌ๋ฆฌ ๋ถ๋ถ์ด ๋ ํํํจ
- ์ข์ฐ ๋์นญ(bell-shaped)
- ํ๋ณธ ํฌ๊ธฐ๊ฐ ํฌ๋ฉด (30 ์ด์) ์ ๊ท๋ถํฌ์ ๊ฑฐ์ ์ ์ฌ
- ์์ ๋๊ฐ ์ปค์ง์๋ก ๋ชจ์๊ฐ ์ปค์ ธ ํ์ค์ ๊ท๋ถํฌ์ ๊ฐ๊น์์ง
์ค์ฌ๊ทนํ์ ๋ฆฌ: ๋ชจ์ง๋จ์ ๋ถํฌ์ ์๊ด์์ด ํ๋ณธ์ ๊ฐ์ $n$์ด ์ปค์ง์๋ก ํ๋ณธํ๊ท ์ ๋ถํฌ๋ ์ ๊ท๋ถํฌ์ ๊ฐ๊น์์ง๋ ํ์
- ๋ชจ์ง๋จ์ ๋ถํฌ๊ฐ ๋์นญ์ด๋ฉด ํ๋ณธ์ ํฌ๊ธฐ๊ฐ ์์๋ ๋์ง๋ง, ๋น๋์นญ์ด๋ฉด ํ๋ณธ์ด 30๊ฐ ์ด์์ด์ด์ผ ํจ
- ํ๋ณธํ๊ท ์ ๋ํ ๊ฒ์ด๋ฏ๋ก ๋ชจ๋ถ์ฐ์ ๋ํ ์ถ๋ก ์๋ ์ง์ ์ ์ผ๋ก ์ ์ฉ๋ ์ ์์
์กฐ๊ฑด๋ถ ํ๋ฅ : ํ ์ฌ๊ฑด์ด ์ผ์ด๋ ๊ฒ์ ์ ์ ๋ก ๋ค๋ฅธ ์ฌ๊ฑด์ด ์ผ์ด๋ ํ๋ฅ (๋ณํ๋ ํ๋ณธ๊ณต๊ฐ์์์ ์ฌ๊ฑด ๋ฐ์ ํ๋ฅ )
$P(A|B) = P(A ∩ B) / P(B)$
$P(A|S) = P(A)$
- ๋ ๋ฆฝ์ฌ๊ฑด: ํ ์ฌ๊ฑด์ ๋ฐ์์ด ๋ค๋ฅธ ์ฌ๊ฑด์ ๋ฐ์ ํ๋ฅ ์ ์ํฅ์ ์ฃผ์ง ์์
- ์ข ์์ฌ๊ฑด: ํ ์ฌ๊ฑด์ ๋ฐ์์ด ๋ค๋ฅธ ์ฌ๊ฑด์ ๋ฐ์ ํ๋ฅ ์ ์ํฅ์ ์ค
- ๋ฐฐ๋ฐ์ฌ๊ฑด: ์๋ก ๋์์ ๋ฐ์ํ์ง ์๋ ์ฌ๊ฑด
ํต๊ณ์ ์ถ์
- ์ ์ถ์ : ํ๋ณธ์์ ์ป์ด์ง๋ ์ ๋ณด๋ฅผ ์ด์ฉํ์ฌ ๋ฏธ์ง ๋ชจ์์ ์ฐธ๊ฐ์ผ๋ก ์๊ฐ๋๋ ํ๋์ ์๋ฅผ ํํ๋ ๊ณผ์
- ๋ชจ์๊ฐ ํน์ ํ ๊ฐ์ผ ๊ฒ์ด๋ผ ์ถ์
- ์ค์ฐจ์ ์ ๋์ ๋ํ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ง ๋ชปํจ
- ์ด๋ ์ ๋๋ ์ณ์์ง์ ๋ํ ํ๋จ X
- ๋ถํธ์ฑ: ์ถ์ ๋์ ๊ธฐ๋๊ฐ์ด ๋ชจ์์ ์ฐจ์ด๊ฐ ์์ด์ผ ํจ
- ์ ํจ์ฑ: ์ต์ ๋ถ์ฐ์ ์ถ์ ๋์ด์ด์ผ ํจ
- ์ผ์น์ฑ: ํ๋ณธ์ ํฌ๊ธฐ๊ฐ ๋ฌดํํ ์ปค์ง๋ฉด ์ถ์ ๋์ด ๋ชจ์์ ์ผ์นํด์ผ ํจ
- ์ถฉ๋ถ์ฑ: ์ถ์ ๋์ด ๋ชจ์์ ๋ํด ๊ฐ์ฅ ๋ง์ ์ ๋ณด๋ฅผ ์ ๊ณตํด์ผ ํจ
- ๊ตฌ๊ฐ ์ถ์ : ๊ด์ฌ์ ๊ฐ๋ ๋ชจ์์ ๋ํ์ฌ ํ๋์ ์์น๊ฐ ์๋ ๊ตฌ๊ฐ์ ์ ์ํ๋ ๋ฐฉ๋ฒ
- ๋ชจ์๊ฐ ํน์ ํ ๊ตฌ๊ฐ์ ์์ ๊ฒ์ด๋ผ๊ณ ์ ์ธ
- ํน์ ์ ๋ขฐ์์ค์ ๋ฐ๋ฅด๋ ์ ๋ขฐ๊ตฌ๊ฐ ์ ๊ณต
- ์ ๋ขฐ๊ตฌ๊ฐ: ๋ชจ์๋ฅผ ํฌํจํ ๊ฒ์ผ๋ก ์ถ์ ํ๋ ๊ตฌ๊ฐ conf.level = 0.95
- ์ ๋ขฐ์์ค: ์ ๋ขฐ๊ตฌ๊ฐ์ด ๋ชจ์๋ฅผ ํฌํจํ ํ๋ฅ
๊ฐ์ค ๊ฒ์
ํต๊ณ์ ๊ฐ์ค๊ฒ์ : ๋ชจ์ง๋จ์ ํน์ฑ์ ๋ํ ์ฃผ์ฅ ๋๋ ๊ฐ์ค์ ์ธ์ฐ๊ณ ํ๋ณธ์์ ์ป์ ์ ๋ณด๋ฅผ ์ด์ฉํด ๊ฐ์ค์ด ์ณ์์ง ํ์ ํ๋ ๊ฒ
- ๊ท๋ฌด๊ฐ์ค($H_0$): ๋๋ฆฝ๊ฐ์ค๊ณผ ์๋ฐ๋๋ ๊ฐ์ค (์ผ๋ฐ์ ์ธ ์ฌ์ค์ ๊ท๋ฌด๊ฐ์ค๋ก ์ค์ )
- ๋๋ฆฝ๊ฐ์ค($H_1$): ์ ์ฆํ๊ณ ์ ํ๋ ๊ฐ์ค (ํจ๊ณผ๊ฐ ์๋ค, ์ฐจ์ด๊ฐ ์๋ค ๋ฑ์ ๋ด์ฉ)
- ์ 1์ข ์ค๋ฅ($α$): ๊ท๋ฌด๊ฐ์ค์ ์ฑํํด์ผ ํ์์๋ ์ด๋ฅผ ๊ธฐ๊ฐํ ์ค๋ฅ
- ์ 2์ข ์ค๋ฅ($β$): ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํด์ผ ํ์์๋ ์ด๋ฅผ ์ฑํํ ์ค๋ฅ
- ์ ์์์ค(significance level: $α$): ์ 1์ข ์ค๋ฅ๋ฅผ ๋ฒํ ํ๋ฅ ์ ์ต๋ ํ์ฉ ํ๊ณ
- ์ ์ํ๋ฅ (p-value): ๊ธฐ๊ฐ์ญ๊ณผ ์ฑํ์ญ์ ๋๋๋ ๊ฒฝ๊ณ๊ฐ / ๊ท๋ฌด๊ฐ์ค ์ง์ง ์ ๋๋ฅผ ๋ํ๋ธ ํ๋ฅ
- ์ฑํ์ญ: ๊ท๋ฌด๊ฐ์ค์ ์ฑํํ๋ ๊ฒ์ ํต๊ณ๋์ ๊ด์ธก๊ฐ ์์ญ
- ๊ธฐ๊ฐ์ญ: ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๋ ๊ฒ์ ํต๊ณ๋์ ๊ด์ธก๊ฐ ์์ญ
- ๊ฒ์ ํต๊ณ๋: ๊ท๋ฌด๊ฐ์ค๊ณผ ๋๋ฆฝ๊ฐ์ค ์ค ์ด๋ ํ๋๋ฅผ ํํ๋ ๋ฐ์ ์ฌ์ฉ๋๋ ํต๊ณ๋
๊ฐ์ค ๊ฒ์ ์ ์ฐจ
- ๊ฒ์ ํ ๊ฐ์ค($H_0$)์ ์ค์
- ์ ์์์ค์ ์ค์ (0.01, 0.05, 0.1)
- ๊ฒ์ ๋ฐฉ๋ฒ(์๊ณ์น)์ ๊ฒฐ์ ํ๊ณ ๊ฒ์ ํต๊ณ๋๊ณผ ์๊ณ์น ๋น๊ต
- p-value(์ 1์ข
์ค๋ฅ๋ฅผ ๋ฒํ ์ค์ ํ๋ฅ )๊ฐ ์ ์์์ค๋ณด๋ค ์์ผ๋ฉด ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ
p-value๊ฐ ์์์๋ก ํด๋น ๊ฒ์ ํต๊ณ๋์ ๊ด์ธก๊ฐ์ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ๋ ๊ฒ์ผ๋ก ํด์ํ ์ ์์
๋น๋ชจ์์ ๊ฒ์
- ํ๋ณธ์ด ๋น์ ๊ท ๋ถํฌ๋ฅผ ๋ณด์ผ ๊ฒฝ์ฐ, ์๋ฃ์ ์๊ฐ 30๊ฐ ๋ฏธ๋ง์ผ ๊ฒฝ์ฐ ์ฌ์ฉ
- ๋ชจ์ง๋จ์ ๋ํ ๊ฐ์ ์ด ์ฝํ ๊ฒ์ด ํน์ง
- ๋ถํฌ์ ๋ชจ์์ ๋ํ ๊ฐ์ค์ ์ธ์ฐ์ง ์์
- ๋ถํฌ์ ํํ์ ๋ํด ๊ฐ์ค์ ์ค์ ํจ
- ๋ชจ์ง๋จ์ ๋ถํฌ์ ๋ํด ์๋ฌด๋ฐ ์ ์ฝ์ ๊ฐํ์ง ์์
- Wilcoxon ์์ํฉ ๊ฒ์ , ๋ถํธ์์ ๊ฒ์ ๋ฑ
๋น๋ชจ์ ๊ฒ์ ํต๊ณ๋
- ๊ด์ธก๊ฐ ์์ฒด๋ฅผ ์ฌ์ฉํ์ง ์๊ณ ๋ถํธ๋ ์์๋ฅผ ์ฌ์ฉ - ๊ฐ๊ณต์ ํตํด ์๋์ ๋น๊ต ๊ด์ธก๊ฐ์ ์ ๋์ ํฌ๊ธฐ์ ์์กดํ์ง ์์
- ๊ฐ์ค๊ฒ์ ์ ํจ์จ ๊ฐ์๋ ์ ๊ณ ์์ ํ ๋ฐฉ๋ฒ์์ด ์ ์ฆ๋จ
- ๋ฐ์ดํฐ๊ฐ ์์๋ก๋ง ์ฃผ์ด์ง๋ค๋ฉด ๋น๋ชจ์์ ๊ฒ์
๋ชจ์ ๊ฒ์ (parametric test) | ๋น๋ชจ์ ๊ฒ์ (nonparametric test) |
๋ฑ๊ฐ์ฒ๋, ๋น์จ์ฒ๋ - ์ซ์ | ๋ช ๋ชฉ์ฒ๋, ์์ด์ฒ๋ |
ํ๊ท | ์ค์๊ฐ |
ํผ์ด์จ ์๊ด๊ณ์ | ์คํผ์ด๋ง ์์์๊ด๊ณ์ |
one sample t-test, two sample t-test, paired t-test, ์นด์ด์ ๊ณฑ ๊ฒ์ , one way anova |
๋ถํธ๊ฒ์ (Sign test), Wilcoxon ๋ถํธ์์๊ฒ์ , Mann-Whitney ๊ฒ์ , Kruskal ๊ฒ์ , ๋ฐ ๊ฒ์ (Run test) |
๋ชจ์ ๊ฒ์ : ๊ด์ธก๊ฐ์ ์ ๋์ ํฌ๊ธฐ์ ์์กดํด ํ๊ท , ๋ถ์ฐ ๋ฑ์ ์ด์ฉํด ๊ฒ์ ์ ์ค์ํจ
์ผ ํ๋ณธ t-๊ฒ์ (one sample t-test) : ํ๋์ ๋ชจ์ง๋จ ํ๊ท ๊ฐ์ ํน์ ๊ฐ๊ณผ ๋น๊ตํ๋ ๊ฒฝ์ฐ ์ฌ์ฉํ๋ ํต๊ณ์ ๋ถ์ ๋ฐฉ๋ฒ ์ผ ํ๋ณธ์ด๋ฏ๋ก ๋ ์ง๋จ์ ํจ๊ณผ๋ฅผ ๋น๊ตํ ์ ์์
ex) A ๊ณต์ฅ์์ ์์ฐ๋๋ ์ง์ฐ๊ฐ์ ํ๊ท ์ค๋์ 50g ์ดํ๋ค
๋ํ๋ฏผ๊ตญ ๋จ์ฑ์ ํ๊ท ๋ชธ๋ฌด๊ฒ๋ 70kg์ด๋ค
์ดํ๋ณธ ๊ฒ์ (two sample t-test): ๋ถ์ฐ๋น ๊ฒ์ ์์ ๋ ํ๋ณธ์ ๋ถ์ฐ์ด ๋์ผํ์ง ๋น๊ตํ๋ ํต๊ณ๋์ F-๋ถํฌ๋ฅผ ๋ฐ๋ฆ
๋์ ํ๋ณธ t-๊ฒ์ (paired t-test) : ๋์ผํ ๋์์ ๋ํด ๋ ๊ฐ์ง ๊ด์ธก์น๊ฐ ์๋ ๊ฒฝ์ฐ ์ด๋ฅผ ๋น๊ตํ์ฌ ์ฐจ์ด๊ฐ ์๋์ง ๊ฒ์ ํ ๋ ์ฌ์ฉ
ex) ๋ ์ง๋จ์ ์ ์ฝ ํฌ์ฝ ์ดํ์ ์ ํ ์์น ๋น๊ต
๋ถํธ๊ฒ์ (Sign test) : ํ๋ณธ๋ค์ด ์๋ก ๊ด๋ จ๋ ๊ฒฝ์ฐ ์ง์ง์ด์ง ๋ ๊ด์ฐฐ์น์ ํฌ๊ณ ์์์ ํ์ํ์ฌ ๋ ํ๋ณธ์ ์ฐจ์ด์ ๋ํ ๊ฐ์ค์ ๊ฒ์ฆํ๋ ๋น๋ชจ์ ๊ฒ์ฆ ๋ฐฉ๋ฒ
๊ด์ฐฐ์น์ ์ฐจ์ด๊ฐ ์์์ธ์ง ์์์ธ์ง์ ๋ฐ๋ผ ๋ถํธ๋ฅผ ๋ถ์ฌ ๊ทธ ๋ถํฌ๋ฅผ ๋ฐํ์ผ๋ก ๊ฐ์ค ๊ฒ์ฆ
๊ต์ฐจ ๋ถ์: 2๊ฐ ์ด์์ ๋ณ์๋ฅผ ๊ฒฐํฉํ์ฌ ์๋ฃ์ ๋น๋๋ฅผ ์ดํด๋ณด๋ ๊ธฐ๋ฒ
- ๋ ๋ฒ์ฃผํ(๋ช ๋ชฉ, ์์ด) ๋ณ์($X, Y$) ๊ฐ์ ๊ด๋ จ์ฑ์ ๋ถ์ํ๊ธฐ ์ํ ๊ฒ์
- $H_0$: $X$์ $Y$ ๊ฐ์ ๊ด๊ณ๊ฐ ์๋ค (์ฐ๊ด์ฑ์ด ์๋ค)
- ์นด์ด์ ๊ณฑ ๊ฒ์ : ์นด์ด์ ๊ณฑ ๊ฒ์ ํต๊ณ๋ ๊ฐ์ ๋ฐ๋ผ ๊ณ์ฐ๋ ์ ์ํ๋ฅ ์ด ์ ์์์ค(ํต์ 0.05)๋ณด๋ค ๋ฎ๋ค๋ฉด ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ
- ๋ณ์์ ๊ด์ฐฐ๋์์ ๋น๊ต๋ ์ ์๋ ๊ธฐ๋๋์๋ฅผ ๊ณ์ฐํจ
- ๊ต์ฐจํ๋ฅผ ์์ฑํด ๊ต์ฐจ๋น๋๋ฅผ ์ง๊ณํ๊ณ ๋ ๋ณ์๋ค ๊ฐ์ ๋ ๋ฆฝ์ฑ ๊ฒ์ ์ ํ ์ ์์
- ๊ธฐ๋๋น๋๊ฐ 5 ๋ฏธ๋ง์ธ ์ ์ ๋น์จ์ด 20%๋ฅผ ๋์ผ๋ฉด ์นด์ด์ ๊ณฑ ๋ถํฌ์ ๊ทผ์ฌํ์ง ์์ผ๋ฉฐ, ํ๋ณธ์ ํฌ๊ธฐ๋ฅผ ๋๋ฆฌ๊ฑฐ๋ ๋ณ์์ ์์ค์ ํฉ์ณ ์ ์ ์๋ฅผ ์ค์ด๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํจ
๋ถ์ฐ ๋ถ์(anova) : ์ธ ๊ฐ ์ด์์ ๋ชจ์ง๋จ์ด ์์ผ๋ฉด ์ฌ๋ฌ ์ง๋จ ์ฌ์ด์ ํ๊ท ์ ๋น๊ตํ๋ ๊ฒ์ ๋ฐฉ๋ฒ
- $H_0$: ๋ชจ๋ ์ง๋จ ๊ฐ ํ๊ท ์ ๊ฐ๋ค
- ์ ๊ท์ฑ / ๋ฑ๋ถ์ฐ์ฑ / ๋ ๋ฆฝ์ฑ
(์ผ์ ๋ฐฐ์น) ๋ถ์ฐ ๋ถ์ (=one-way ANOVA)
- ๋ฒ์ฃผํ ๋ณ์์ธ ๋ ๋ฆฝ๋ณ์($X$)์ ์ฐ์ํ ๋ณ์์ธ ์ข ์๋ณ์($Y$) ๊ฐ์ ๊ด๊ณ๋ฅผ ๋ถ์ํ๋ ๋ฐฉ๋ฒ๋ก
- ์ผ์ vs ์ด์ : ๋ ๋ฆฝ๋ณ์์ ๊ฐ์
- ์์ค(Level): ๋ฒ์ฃผํ ๋ ๋ฆฝ๋ณ์๊ฐ ๊ฐ์ง ์ ์๋ ๊ฐ
- $H_0$: $X$์ ์์ค(level)์ ๋ฐ๋ผ $Y$์ ๊ฐ์ ์ฐจ์ด๊ฐ ์๋ค
- F-๊ฒ์ : F ๊ฒ์ ํต๊ณ๋ ๊ฐ์ ๋ฐ๋ผ ๊ณ์ฐ๋ ์ ์ํ๋ฅ ์ด ์ ์์์ค(ํต์ 0.05)๋ณด๋ค ๋ฎ๋ค๋ฉด ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ
์ผ๋ฐ์ ์ผ๋ก ๋ถ์ฐ→F-๊ฒ์ / ํ๊ท →t-๊ฒ์ ์ฌ์ฉํจ
'ADsP' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
ADsP 3๊ณผ๋ชฉ 4-3 ํ๊ท๋ถ์ | ์ ๋ฆฌ๐ (1) | 2024.09.19 |
---|---|
ADsP 3๊ณผ๋ชฉ 4-2 ๊ธฐ์ด ํต๊ณ ๋ถ์ | ์ ๋ฆฌ๐ (0) | 2024.09.18 |
ADsP 3๊ณผ๋ชฉ 3-2 ๊ธฐ์ด ๋ถ์ ๋ฐ ๋ฐ์ดํฐ ๊ด๋ฆฌ | ์ ๋ฆฌ๐ (1) | 2024.09.16 |
ADsP 3๊ณผ๋ชฉ 3-1 ๋ฐ์ดํฐ ๋ณ๊ฒฝ ๋ฐ ์์ฝ | ์ ๋ฆฌ๐ (1) | 2024.09.13 |
ADsP 3๊ณผ๋ชฉ 2. R ํ๋ก๊ทธ๋๋ฐ ๊ธฐ์ด | ์ ๋ฆฌ๐ (0) | 2024.09.12 |