다차원 척도법
여러 대상 간의 거리가 주어져 있을 때, 대상들을 동일한 상대적 거리를 가진 실수공간의 점들로 배치시키는 방법.
군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들 사이의 유사성/비유사성을 측정하여 개체들을 2차원 공간상에 점으로 표현
- stress값을 통해 적합여부를 판단 0에 가까울 수록 적합도가 높음
주성분분석
여러 변수 중 서로 상관성이 높은 변수들의 선형 결합으로 새로운 변수(주성분)을 만들어 기존 변수를 요약 및 축소하는 분석 기법
목적
- 다중공선성이 존재하는 경우, 상관성이 없는(적은) 주성분으로 변수들을 축소해 모형 개발에 활용된다. 상관 관계가 높은 다중공선성이 존재하면 잘못만들어짐.
- 연관성이 높은 변수를 주성분분석을 통해 자원을 축소한 후, 군집분석을 수행하면 군집화 결과와 연산 속도를 개선 가능
scree plot (스크리 플롯)
그래프가 수평을 이루기 전 단계를 주성분의 수로 선택할 수 있다.(꺾이는 부분)
시계열 분석
자기상관성: 인접한 자료들과 상호 연관선을 가진다.
자료: 정상성/비정상성 시계열 자료로 구분됨
- 정상성: 평균값, 분산값 시간과 관계없이 일정. 공분산은 시간에 의존하지 않고 시차에만 의존
분석 기법
이동평균볍: 시간이 지남에 따라 평균 계산에 포함되는 자료가 변동. 변동이 많은 시계열 데이터 평균을 구해 여러 요인으로 인한 변독 제거(꼐절 및 불규칙 변동)
지수평활법:
자기회귀모형
- 과거 시점의 관측 자료들의 선형 결합으로 표현한 모형
- 자기회귀 모형은 시계열 자료를 설명하기 위한 모형 중 하나로서 t라는 시점에서의 값 yt는 이전 시점들 n개에 의해 설명될 수 있음을 의미한다.
자기상관계수, 부분자기상관계수
이동평균 모형
- 현 시점의 자료를 유한개의 백색잡음의 선형결합으로 표현
자기회귀누적이동평균 모형
- 비정상 시계열 모형이기 때문에 차분이나 변환을 통해 AR모형이나 MA모형, ARMA 모형으로 정상화
- d는 ARIMA에서 ARMA로 정상화할 때 몇 번 차분을 했는지를 의미
분해 시계열
- 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법