ADsP

ADsP 3κ³Όλͺ© 4-6 μ£Όμ„±λΆ„ 뢄석 | μ •λ¦¬πŸ“

studyrooom 2024. 9. 24. 17:47
SMALL

μ£Όμ„±λΆ„ 뢄석(PCA): 톡계적 차원 μΆ•μ†Œ 기법
데이터듀이 λ³€μˆ˜λ₯Ό μš”μ•½ν•˜μ—¬ ν•˜λ‚˜μ˜ λ³€μˆ˜λ‘œλ§Œ λ°μ΄ν„°μ˜ μœ„μΉ˜ 정보λ₯Ό λ‚˜νƒ€λ‚΄λŠ” 것이 λͺ©μ 
상관성이 높은 λ³€μˆ˜λ“€μ˜ μ„ ν˜• κ²°ν•©μœΌλ‘œ λ§Œλ“€μ–΄ 기쑴의 상관성이 높은 λ³€μˆ˜λ“€μ„ μš”μ•½, μΆ•μ†Œν•˜λŠ” 기법

  • 닀차원 λ°μ΄ν„°μ…‹μ˜ 차원을 μΆ•μ†Œν•˜μ—¬ λ°μ΄ν„°μ˜ ꡬ쑰λ₯Ό νŒŒμ•…ν•¨
    λ³€μˆ˜λ“€λΌλ¦¬ 상관성이 μžˆλŠ” 경우 λ°œμƒν•˜λŠ” 해석 μƒμ˜ λ³΅μž‘ν•œ ꡬ쑰적 문제λ₯Ό 해결함
  • λ°μ΄ν„°μ˜ 정보(λΆ„μ‚°)λ₯Ό κ°€μž₯ 잘 λ³΄μ‘΄ν•˜λŠ” μƒˆλ‘œμš΄ λ³€μˆ˜(μ£Όμ„±λΆ„) 생성
    • μ£Όμ„±λΆ„ κ°„ μƒν˜Έ 독립
    • p개의 λ³€μˆ˜λ“€μ„ μ€‘μš”ν•œ m(p)개의 μ£Όμ„±λΆ„μœΌλ‘œ ν‘œν˜„ν•΄ 전체 변동을 μ„€λͺ…ν•˜λŠ” κ²ƒμœΌλ‘œ m개의 주성뢄은 μ›λž˜ λ³€μˆ˜μ—μ„œ μ„œλ‘œ 상관성이 높은 λ³€μˆ˜λ“€μ˜ μ„ ν˜•κ²°ν•©μœΌλ‘œ μƒμ„±λœ λ³€μˆ˜μž„
  • 전체 λ³€μˆ˜ μ‚¬μš© λŒ€μ‹  λ„μΆœλ˜λŠ” λͺ‡ 개의 μƒˆλ‘œμš΄ λ³€μˆ˜λ§Œμ˜ μ‚¬μš©μœΌλ‘œ 뢄석을 λŒ€μ‹ ν•  수 있음
  • μ£Όμ„±λΆ„μ˜ κ°œμˆ˜λŠ” λˆ„μ  κΈ°μ—¬μœ¨μ„ 톡해 κ²°μ • (85~90% 이상)
  • μ„ ν˜•λ³€ν™˜ ν•„μš”
  • 제1주성뢄은 변동을 μ΅œλŒ€λ‘œ μ„€λͺ…ν•΄μ£ΌλŠ” λ°©ν–₯으둜 λ³€μˆ˜λ“€μ˜ μ„ ν˜•κ²°ν•©μ‹
  • 이둠적으둜 μ£Όμ„±λΆ„ κ°„ 상관관계가 μ—†μŒ
  • λΉ„μ§€λ„ν•™μŠ΅μ— 해당함

 

μ£Όμ„±λΆ„ 뢄석 ν•„μš”μ„±

  • 차원 μΆ•μ†Œ: μ‹œκ°ν™”, 뢄석, λͺ¨λΈλ§μ— 용이, μ„€λͺ…λ ₯ ν–₯상
  • ꡰ집뢄석 μ‹œ λͺ¨ν˜•μ˜ μ„±λŠ₯ ν–₯상
  • νšŒκ·€λΆ„μ„μ—μ„œ 닀쀑곡선성(Multicollinearity) 제거: λ…λ¦½λ³€μˆ˜ κ°„ μƒκ΄€κ΄€κ³„λ‘œ 인해 λ°œμƒν•˜λŠ” 닀쀑곡선성 제거λ₯Ό ν†΅ν•œ λͺ¨λΈμ˜ μ•ˆμ •μ„± 증가
    • ν‰ν‰ν•΄μ§€λŠ” μ§€μ μ—μ„œ 멈좀 β†’ 3개
  • λ…Έμ΄μ¦ˆ 제거: λ°μ΄ν„°μ˜ μ£Όμš” ꡬ쑰λ₯Ό ν‘œν˜„ν•˜μ—¬ λ…Έμ΄μ¦ˆ 제거
  • IoT μ„Όμ„œ 데이터λ₯Ό μ£Όμ„±λΆ„ 뢄석 ν›„ 슀마트 νŒ©ν† λ¦¬μ— ν™œμš©

 

μ£Όμ„±λΆ„ 개수 선택 방법
주성뢄을 κ΅¬μ„±ν•˜λŠ” κ³„μˆ˜ ꡬ쑰λ₯Ό νŒŒμ•…ν•΄ μ μ ˆν•˜κ²Œ ν•΄μ„λ˜μ–΄μ•Ό ν•˜λ©°, λͺ…ν™•ν•˜κ²Œ μ •μ˜λœ 해석법이 μžˆλŠ” 것은 μ•„λ‹˜
λˆ„μ κΈ°μ—¬μœ¨, κ³ μœ³κ°’, Scree Plot을 톡해 정함

  • 전체 변이 κ³΅ν—Œλ„(percentage of total variance) 방법: 전체 λ³€μ΄μ˜ 70~90% 정도가 λ˜λ„λ‘ κ²°μ •
  • 평균 κ³ μœ³κ°’(average eigenvalue) 방법: κ³ μœ κ°’λ“€μ˜ 평균을 κ΅¬ν•œ ν›„ κ³ μœ κ°’μ΄ 평균값 이상이 λ˜λŠ” 주성뢄을 μ„€μ •ν•˜λŠ” 방법
    기쑴보닀 큰 κ³ μœ³κ°’μ˜ κ³„μˆ˜λ‘œ μ •ν•  수 있음
  • Scree graph 방법: κ³ μœ κ°’μ˜ 크기순으둜 산점도λ₯Ό κ·Έλ¦° κ·Έλž˜ν”„μ—μ„œ κ°μ†Œν•˜λŠ” μΆ”μ„Έκ°€ μ›λ§Œν•΄μ§€λŠ” μ§€μ μ—μ„œ 1을 λΊ€ 개수λ₯Ό 선택
λ°˜μ‘ν˜•
LIST