ADsP

ADsP 3κ³Όλͺ© 4-4 μ‹œκ³„μ—΄ 뢄석 | μ •λ¦¬πŸ“

studyrooom 2024. 9. 20. 17:42
SMALL

μ‹œκ³„μ—΄ 뢄석

μ‹œκ³„μ—΄μ΄ 정상인지 νŒλ‹¨ν•˜κΈ° μœ„ν•΄ 폭발적인 μΆ”μ„Έλ₯Ό λ³΄μ΄κ±°λ‚˜ μ‹œκ°„μ— 따라 뢄산이 λ³€ν™”ν•˜λŠ”μ§€ κ΄€μ°°ν•΄μ•Ό 함
μ™ΈλΆ€μΈμžμ™€ κ΄€λ ¨ν•΄ κ³„μ ˆμ μΈ νŒ¨ν„΄, 좔세와 같은 μš”μ†Œλ₯Ό μ„€λͺ…ν•  수 μžˆλŠ” λͺ¨λΈμ„ κ²°μ •ν•˜λŠ” 것

  • μ‹œκ³„μ—΄ 데이터: μ‹œκ°„μ˜ 흐름에 따라 κ΄€μ°°ν•œ κ΄€μΈ‘κ°’
    • μ‹œκ³„μ—΄ λ°μ΄ν„°μ˜ λͺ¨λΈλ§μ€ λ‹€λ₯Έ 뢄석λͺ¨ν˜•κ³Ό 같이 탐색 λͺ©μ κ³Ό 예츑 λͺ©μ μœΌλ‘œ λ‚˜λˆŒ 수 있음
  • 정상성(Stationarity): μ‹œκ°„μ˜ 흐름에 따라 톡계적 νŠΉμ„±(λΆ„μ‚°, 평균)이 λ³€ν•˜μ§€ μ•ŠλŠ” μ„±μ§ˆ
    • 약정상성(μ‹œμ°¨μ—λ§Œ μ˜μ‘΄ν•˜λŠ” 곡뢄산)
      : λͺ¨λ“  μ‹œμ μ— κΈ°λŒ“κ°’κ³Ό 뢄산이 μΌμ •ν•˜κ³  자기 곡뢄산은 μ‹œμ°¨μ—λ§Œ 의쑴
    • 정상 μ‹œκ³„μ—΄μ€ μ–΄λ–€ μΌμ •ν•œ 값을 μ€‘μ‹¬μœΌλ‘œ μΌμ •ν•œ 변동 폭을 가짐
    • μ•ˆμ •μ  μ‹œκ³„μ—΄: μ‹œκ°„μ˜ 좔이와 관계 없이 평균, 뢄산이 λΆˆλ³€ν•˜μ—¬, λ³€ν–ˆλ‹€κ³  해도 λ‹€μ‹œ ν‰κ· μœΌλ‘œ νšŒκ·€ν•˜λŠ” κ²½ν–₯을 λ³΄μž„
  • 비정상성 μ‹œκ³„μ—΄μ€ 톡계 뢄석이 μ–΄λ €μ›Œ 정상 μ‹œκ³„μ—΄λ‘œ λ³€ν™˜ν•΄ μ€˜μ•Όν•¨ (λŒ€λΆ€λΆ„ 비정상 μ‹œκ³„μ—΄)
    • μ°¨λΆ„(differencing): μ‹œμ  κ°„ λ³€ν™”λŸ‰ (평균이 μΌμ •ν•˜μ§€ μ•Šμ„ λ•Œ)
    • λ³€ν™˜: 둜그 λ³€ν™˜, Box-cox λ³€ν™˜ λ“± (뢄산이 μΌμ •ν•˜μ§€ μ•Šμ„ λ•Œ)

 

μ‹œκ³„μ—΄ 데이터 뢄석 ν”„λ‘œμ„ΈμŠ€

  1. μ‹œκ°„ κ·Έλž˜ν”„ 그리기
  2. 좔세와 κ³„μ ˆμ„± 제거
  3. μž”μ°¨ 예츑
  4. μž”μ°¨μ— λŒ€ν•œ λͺ¨λΈ μ ν•©ν•˜κΈ°
  5. 예츑된 μž”μ°¨μ— 좔세와 κ³„μ ˆμ„±μ„ 더해 미래 예츑

 

μ‹œκ³„μ—΄ 뢄석 기법

  • 이동평균법: κ³„μ ˆ, λΆˆκ·œμΉ™ 변동을 μ œκ±°ν•˜κ³ , 좔세와 μˆœν™˜λ³€λ™λ§Œ κ°€μ§„ μ‹œκ³„μ—΄ 자료둜 λ³€ν™˜ν•˜λŠ” ν‰ν™œλ²•
  • μ§€μˆ˜ν‰ν™œλ²•: μ‹œκ°„μ˜ 흐름에 따라 졜근 μ‹œκ³„μ—΄μ— 더 λ§Žμ€ κ°€μ€‘μΉ˜λ₯Ό λΆ€μ—¬ν•˜μ—¬ 미래λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 방법
    • λ‹¨μˆœμ§€μˆ˜ν‰ν™œλ²•: μΆ”μ„Έλ‚˜ κ³„μ ˆμ„±μ΄ μ—†μ–΄ 평균이 λ³€ν™”ν•˜λŠ” μ‹œκ³„μ—΄μ— μ‚¬μš©ν•˜λŠ” 방법
    • μ΄μ€‘μ§€μˆ˜ν‰ν™œλ²•: 평균을 ν‰ν™œν•˜λŠ” λͺ¨μˆ˜μ™€ ν•¨κ»˜ μΆ”μ„Έλ₯Ό λ‚˜νƒ€λ‚΄λŠ” 식을 λ‹€λ₯Έ λͺ¨μˆ˜λ‘œ ν‰ν™œν•˜λŠ” 방법

 

μ‹œκ³„μ—΄ λΆ„ν•΄: μ‹œκ³„μ—΄μ„ λͺ‡ κ°€μ§€ μš”μΈμœΌλ‘œ λΆ„ν•΄ν•˜μ—¬ λΆ„μ„ν•˜λŠ” 방법둠

  • μΆ”μ„Έ(Trend): μ‹œκ°„(μž₯κΈ°)에 λ”°λ₯Έ κ°’μ˜ 증가/κ°μ†Œ
    ν™•λ₯ κ³Όμ •μ˜ κΈ°λŒ“κ°’μœΌλ‘œ μ„ ν˜•μ  ν˜•νƒœ, μ§€μˆ˜μ  ν˜•νƒœ 등이 있음
  • κ³„μ ˆμ„±(Seasonality): 일정 λΉˆλ„λ‘œ λ°˜λ³΅λ˜λŠ” νŒ¨ν„΄(단기간 λ™μ•ˆ 주기적)
  • μ£ΌκΈ°(Cycle, μˆœν™˜): μΌμ •ν•˜μ§€ μ•Šμ€ λΉˆλ„λ‘œ λ°˜λ³΅λ˜λŠ” νŒ¨ν„΄
    경제적 · μžμ—°μ  이유 없이 μ•Œλ €μ§€μ§€ μ•Šμ€ μ£ΌκΈ°λ₯Ό κ°–κ³  λ³€ν•˜λŠ” 자료
  • μž”μ°¨(Residual, λΆˆκ·œμΉ™): μΆ”μ„Έ/κ³„μ ˆμ„±/μ£ΌκΈ° λ“±μ˜ μš”μΈμ„ μ œκ±°ν•˜κ³  남은 μš”μΈ

Y = T + S + C + I : μ‹œκ³„μ—΄μ„ λ§μ…ˆμ΄λ‚˜ κ³±μ…ˆμœΌλ‘œ λΆ„ν•΄ν•˜κΈ°λ„ 함

 

 

μ‹œκ³„μ—΄ λͺ¨ν˜•

  • λ°±μƒ‰μž‘μŒ(White Noise): μ„œλ‘œ 독립이고 λ™μΌν•œ 뢄포λ₯Ό λ”°λ₯΄λŠ” ν™•λ₯ λ³€μˆ˜λ“€μ˜ κ³„μ—΄λ‘œ κ΅¬μ„±λœ ν™•λ₯ κ³Όμ„±μœΌλ‘œμ„œ 평균이 0을 따름
    평균 0 : λ°±μƒ‰μž‘μŒμ— λŒ€ν•œ 합이 0에 μˆ˜λ ΄ν•¨
    μž‘μŒμ€ λ¬΄μž‘μœ„μ μΈ λ³€λ™μœΌλ‘œ 원인이 μ•Œλ €μ Έ μžˆμ§€ μ•ŠμŒ
  • 이동평균(Moving Average)
    $Y_t=ε_t+ θ_1ε_{t−1}+θ_2ε_{t−2}+β‹―+θ_qε_{t−q}$
    • μ‹œμ μ΄ λ‹€λ₯Έ λ°±μƒ‰μž‘μŒμ˜ λΉ„μ„ ν˜• κ²°ν•©μœΌλ‘œ 이루어짐
    • μ‹œκ³„μ—΄ λ°μ΄ν„°μ˜ λΉ„μ„ ν˜• κ²°ν•©
    • 항상 정상성을 λ§Œμ‘±ν•˜κ³ , μΌμ •ν•œ 주기와 νŒ¨ν„΄μ„ 가짐
    • ACF의 μ ˆλ‹¨μ μ„ 톡해 λͺ¨ν˜•μ˜ 차수($q$)λ₯Ό νŒλ‹¨
  • μžκΈ°νšŒκ·€(Auto-Regressive): 이전 μ‹œμ μ˜ μžλ£Œκ°’μ— μ˜ν•œ μ„ ν˜•κ²°ν•©
    $Y_t=Ο•_1Y_{t−1}+Ο•_2Y_{t−2}+β‹―+Ο•_pY_{t−p}+ε_t$
    • ν˜„μž¬($t$) μ‹œμ μ˜ 데이터가 $p$ μ‹œμ  이전 ($t-p$)의 λ°μ΄ν„°λ‘œλΆ€ν„° 영ν–₯을 λ°›λŠ” λͺ¨ν˜•
    • $Ο•$ : μΌμ’…μ˜ νšŒκ·€κ³„μˆ˜
    • $ε_t$ : λ°±μƒ‰μž‘μŒ κ³Όμ •(White Noise) 평균 0, μΌμ •ν•œ λΆ„μ‚°, μ‹œκ°„μ˜ 흐름에 λ”°λ₯Έ 상관성 μ—†μŒ
    • PACF의 μ ˆλ‹¨μ μ˜ μ‹œμ μ„ 톡해 AR λͺ¨ν˜•μ˜ 차수($p$)λ₯Ό νŒλ‹¨
  • μžκΈ°νšŒκ·€ 이동평균(Auto-Regressive Moving Average)
  • μžκΈ°νšŒκ·€ λˆ„μ  이동평균(Auto-Regressive Integrated Moving Average) (ARIMA λͺ¨ν˜•)
    : $d$번 μ°¨λΆ„ν•œ μ‹œκ³„μ—΄μ΄ 정상성을 띠고 ARMA($p, q$) λͺ¨ν˜•을 λ”°λ₯Ό λ•Œ, 원 μ‹œκ³„μ—΄μ„ **ARIMA($p, d, q$)**둜 ν‘œν˜„
    ex) ARIMA(1, 1, 1)을 λ”°λ₯΄λŠ” μ‹œκ³„μ—΄ YλŠ” d=1번 μ°¨λΆ„ ν›„ ARMA(1, 1)을 λ”°λ₯΄λŠ” μ •상 μ‹œκ³„열이 λ¨
    • κ°€μž₯ 일반적인 λͺ¨ν˜• (비정상성 μ‹œκ³„μ—΄ λͺ¨ν˜•)
    • p = 0 : IMA($d, q$) —μ°¨λΆ„→ MA($q$)
    • d = 0 : ARMA($p, q$)
    • q = 0 : ARI($p, d$)
    νŒŒλΌλ―Έν„°($p, q$) μΆ”λ‘ 
    • μžκΈ°νšŒκ·€ = AR(p)
      • ACF : μ§€μˆ˜μ  κ°μ†Œ
      • PACF : $p+1$ μ‹œμ λΆ€ν„° μ ˆλ‹¨ (0으둜 수렴)
    • 이동평균 = MA(q)
      • ACF : $q+1$ μ‹œμ λΆ€ν„° μ ˆλ‹¨ (0으둜 수렴)
      • PACF : μ§€μˆ˜μ  κ°μ†Œ

 

ACF와 PACF

자기 상관성(Auto-Correlation): ν™•λ₯ λ³€μˆ˜ $X$의 μ„œλ‘œ λ‹€λ₯Έ 두 μ‹œμ μ˜ κ΄€μΈ‘μΉ˜ 사이에 μ‘΄μž¬ν•˜λŠ” 상관성

  • ACF(자기 μƒκ΄€ν•¨μˆ˜): 자기 상관성을 λ‚˜νƒ€λ‚΄λŠ” μƒκ΄€κ³„μˆ˜
    μ‹œκ°„μ˜ 흐름에 λ”°λ₯Έ λ³€μˆ˜ κ°„μ˜ 상관관계 λ³€ν™”
    • 이동평균(MA) 차수(order) νŒλ‹¨μ— μ“°μž„
  • PACF(νŽΈμžκΈ°μƒκ΄€ν•¨μˆ˜): νŠΉμ • μ‹œμ°¨κ°€ μ•„λ‹Œ λ‹€λ₯Έ λ³€μˆ˜μ˜ 영ν–₯을 μ œκ±°ν•œ μ‹œμ°¨μ— λ”°λ₯Έ μƒκ΄€κ³„μˆ˜
    (λΆ€λΆ„ 자기 μƒκ΄€κ³„μˆ˜)
    두 μ‹œκ³„μ—΄ ν™•λ₯ λ³€μˆ˜ 간에 λ‹€λ₯Έ μ‹œμ μ˜ ν™•λ₯ λ³€μˆ˜ 영ν–₯λ ₯은 ν†΅μ œν•˜κ³  μƒκ΄€κ΄€κ³„λ§Œ λ³΄μ—¬μ€Œ
    • μžκΈ°νšŒκ·€(AR) 차수(order) νŒλ‹¨μ— μ“°μž„

      ACF: μ‹œμ°¨ μ•ˆμœΌλ‘œ λ“€μ–΄κ°€κΈ° μ „κΉŒμ§€ / PACF: μ‹œμ°¨ λ°–μœΌλ‘œ νŠ€μ–΄λ‚˜μ˜¨ κ±°

 

λ°˜μ‘ν˜•
LIST