데이터

제로베이스 데이터사이언스 스쿨 - Part 04. 기초 통계-18

Leah (리아) 2025. 11. 25. 17:05
반응형

Chapter 02. 기초통계_심화과정

 

시계열 분석(Time Series Analysis)


1. 주요 개념 요약

시계열 분석이란?

시간 흐름에 따라 기록된 데이터를 분석하여 미래 값을 예측하거나 패턴(트렌드·계절성·주기·불규칙)을 파악하는 방법.

시계열 데이터 종류

  • 연속 시계열: 시간 간격이 연속적(초·분·시간 등)
  • 이산 시계열: 일정 간격(일·월·분기·년 등)

시계열 구성 요소

  1. Trend(추세): 장기적으로 증가/감소하는 흐름
  2. Seasonality(계절성): 주기적 반복(요일·계절·연말 등)
  3. Cycle(주기성): 경기 순환 등 불규칙적 장기 반복
  4. Irregular Movements(불규칙 요인): 예측 불가한 노이즈

2. 전통적 시계열 분석 방법

이동평균(MA, Moving Average)

최근 데이터의 평균을 예측값으로 사용

지수평활법(Exponential Smoothing)

가까운 시점일수록 가중치를 높여 예측

자기상관 모델(AR, Autoregressive)

과거 값들이 현재에 영향
예: AR(1), AR(2)

이동평균 모델(MA)

과거 오차를 기반으로 예측

ARIMA 모델

AR + I(차분을 통한 정상성 확보) + MA
→ 가장 널리 사용되는 시계열 예측 모델


3. 시계열 분석 방법론 선택 기준

구분 방법론 특징
장기 예측 회귀 기반 방법 큰 추세 파악에 적합
직관적 방법 시계열 분해 트렌드·계절성·불규칙 요소를 분리
다중 시계열 VAR, 전이함수모형, 다변량 ARIMA 여러 변수 간 인과관계까지 예측

4. 코드 예시 (R)

단순 이동평균

 
library(TTR)
ma <- SMA(data$Y, n=3)
plot(ma, type="l")

지수평활법

 
library(forecast)
fit <- ses(data$Y)
plot(fit)

ARIMA 자동 탐색

fit <- auto.arima(data$Y)
forecast(fit, h=12)

 

 

* 이 글은 제로베이스 데이터사이언스 파트타임 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다.


 

💡 생각 정리

시계열 분석의 핵심은 단순한 시간 기반 예측이 아니라, 데이터 속 숨은 패턴과 구조를 해석하는 과정이라는 점이다.
추세, 계절성, 주기성 등 여러 요소가 복합적으로 작용하기 때문에 단순 모델보다는 적절한 해석과 전처리가 필수적이다.
특히 정상성 확보와 계절성 파악은 모델의 예측력을 크게 좌우하므로, 분석 시작 전 반드시 구조 확인을 거쳐야 한다.


🚀 적용점

 

  • 쇼핑몰: 요일·월별 매출 예측, 프로모션 일정 최적화
  • 금융: 주가·거래량 분석, 포트폴리오 전략 수립
  • 제조·물류: 수요 예측으로 재고/생산 효율화
  • 서비스업: 트래픽 예측, 예약률 예측, 마케팅 일정 관리
  • 스타트업/운영 데이터: 사용자 증가 추세 분석

 

반응형