[회귀분석] 회귀분석의 의의와 주요용어, 회귀모형의 도출과 절차
목차
회귀분석
Ⅰ. 회귀분석의 의의
Ⅱ. 회귀분석의 용어와 절차
1. 회귀분석의 주요용어
2. 회귀모형의 도출과 절차
회귀분석
1) 회귀분석의 의의
회귀분석(regression analysis)은 독립변수가 종속변수에 미치는 영향력의 크기를 측정하여 독립변수의 일정한 값에 대응되는 종속변수의 값을 예측하기 위한 방법이다. 별은 의미에서의 회귀분석은 상관관계분석의 개념도 포함하고 있으나 일반적으로 회귀분석은 변수 간의 관계식을 알아보기 위한 통계적 분석을 의미한다.
또한 단순히 변수들 사이의 관계만을 파악하는 것에 그치지 않고, 그러한 관계를 이용하여 어떤 예측(Prediction)의 근거로 사용하고자 하는 경우가 있다.
즉 주어진 변수 X와 변수 Y의 관계를 알았을 때, 의 특정 값을 가지고 이에 상응하는 Y의 값을 예측할 수 없을까라는 이러한 질문에 해답을 제공하는 것이 회귀분석을 이용하는 통계방법이다.
즉 회귀분석은 변수들 간의 관계를 알아보기 위한 통계적 분석기법을 말한다. 이때 종속변수, 독립변수가 각각 하나인 모형을 분석하는 경우를 단순회귀분석(simple regression analysis)이라 하고 종속변수가 하나이고 독립변수가 2개 이상인 모형을 분석하는 경우를 다중회귀분석(multiple regression analysis)이라 한다.
예를 들어 상품의 가격(독립변수)이 상품의 수요(종속변수)에 얼마만큼의 영향을 미치는가를 알고자 한다면 이는 단순회귀분석이 될 것이고, 국민소득과 자동차의 가격(2개의 독립변수)이 자동차의 수요(종속변수)에 어떠한 영향을 미치는가를 알고자 한다면 이는 다중회귀분석이 될 것이다.
2) 회귀분석의 용어와 절차
(1) 희귀분석의 주요용어
회귀분석의 결과 도출되는 산포도(散布度: scatter diagram)란 두 변수의 짝들
을 좌표상에 표시한 그림을 말하는데, 이와 같은 산포도는 두 변수…(생략)
|
ms of Squares), 표본회귀선에 의해 설명된 변동(SSR: Sums of Squares due to Regression)이라 부른다. 결정 계수는 R2로 표기하며, 결정계수는 0과 1 사이의 값을 가지며 이 수치가 높을수록 표본 회귀선의 설명력이 높다고 본다. 결정계수는 독립변수가 증가함에 따라 증가하는 경향이 있으므로 적합도를 판정함에 있어 자유도를 고려한 것이 조정된 결정계수이다.
(2) 희귀모형의 도출과 절차
단순선형회귀모형은 두 변수 사이에 선형적인 상관관계가 존재할 때 그 관계의 모양을 가장 잘 표현해 줄 수 있는 선을 도출해 변수간 관계를 표사하는 방법이다. 그리고 회귀선을 수학적으로 도출해내기 위하여 사용하는 방법으로 최소자승법이 있다. 최소자승법을 사용한 회귀직선에는 다음과 같은 두 가지 특성이 있다.
첫째, 시계열자료로 나타나고 있는 관측된 값과 회귀직선상 값의 차의 합은 항상 0이다. 즉, 회귀직선상의 값 Yt에서 시계열적으로 관측된 값 Y를 뺀 값(편차)의 총합은 0이다. 어떤 연도에 있어서 관측치가 회귀선 아래에 있게 되는 경우 편차(Y-Yt)는 항상 (-)값을 가지며, 이와는 반대로 그 관측치가 회귀선보다 위족에 있는 경우에는 편차(Y-Yt)는 항상(+)값을 가진다. 이러한 (+)값과 (-)값은 서로 상쇄되어 (Y-Yt)=0이 된다.
둘째, 각각의 편차를 제곱하여 총합을 구할 때 그 값이 최소가 되도록 회귀직선의 절편과 기울기가 정해져야 한다. 즉, 최소자승 회귀직선이 시계열적으로 관측된 자료들을 통과하는 직선을 긋는 가장 능률적인 방법임을 뜻한다.
`최소자승`이란 그 기법이 회귀선(경향성)으로부터 떨어져 있는 시계열상의 관측치들의 편차를 제곱한 값을 최소화할 수 있다는 의미이다.
최소자승경향법을 이용한 회귀방정식은 아래와 같은 형태를 가지고 있다.
일단 a, b의 값이 구해지면 주어진 시점에 있어서의 Y값을 추정할 수 있으며, 이러한 방정식을 이용하여 미래 일정시점에서의 예측값을 얻을 수 있다.
Yt