01. 총설 1) 회귀분석 인과관계가 있는 변수들 사이의 선형적 함수관계를 분석하는 기법 3) 인과관계 ① 일정 비용의 광고를 할 때 매출액이 얼마나 늘어나는가의 예측 목적 광고비 (독립변수, 설명변수) -> 매출액 (종속변수: 독립변수에 설명됨) ② 상관분석(corelation analysis) 이란 : 두 변수간의 움직임의 관계를 나타내며 인과관계가 전제하지 않음. ③ 회귀분석: 우선 두 변수간의 인과관계를 논리적으로 파악하는 것이 중요. 파악된 인과관계를 선형적 함수관계로 표시하는 기법임. 3) 회귀분석의 종류 ① 단순회귀분석: 독립변수 1개로 1개의 종속변수를 예측하는 것 ② 다중회귀분석: 다수의 독립변수로 1개의 종속변수를 예측하는 것 02. 단순회귀분석 1) 회귀방정식 ① 소득이 높을수록 소비가 증가하지만 동일한 소득이라도 가족수, 환경, 소비성향에 따라 소비가 다를 수 있다 - 함수관계: 일정소득에 대하여 소비수준이 하나값인 관계 - 확률적 관계: 일정소득에 대하여 여러 소비수준이 주어지는 관계 ② 회귀모형: 확률적 관계를 식으로 나타낸 것 yi = α + βxi + εi 오차항 εi: 평균0, 분산이 σ2인 정규분포 한다. α 와 β : 모집단 회귀방정식의 회귀계수로서 상수임. ※ 공식요약: 회귀모형의 기본가정 - 오차항 εi는 평균이 0인 정규분포를 한다. - 오차항 εi는 모든 xi에 대하여 동일한 분산, 즉 등분산을 가진다 - 오차항 εi는 서로 독립적, 즉 비자기상관(no autocorrelation)이다 ③ 회귀방정식: 독립변수 X에 대한 종속변수 Y값 분포의 기대값 E(yi) = α + βxi Var(yi) = σ2 => 함수관계를 의미 ④ 표본회귀모형: 모집단회귀모형과 모집단회귀방정식을 추정하기 위한 식 yi = a + bxi +ei 잔차 (residuals) ei : 오차항 εi 의 추정치 실제의 표본관찰값과 예측된 값과의 차이 ⑤ 표본 자료에 가장 적합한 표본회귀식 구하기 ∑ei2를 최소화하는 최소제곱법으로 직선으로 구함. ei = yi - (a + bxi) 2) 적합도와 유의성 검정 ① 회귀선의 적합도 측정: 결정계수(coefficient of determination) - "총변동 = 회귀로 인한 변동 + 잔차로 인한 변동"을 제곱하면 "총편차제곱합(SST) = 회귀제곱합(SSR) + 잔차제곱합(SSE)" 1 = SSR/SST + SSE/SST => 1 = R2 + (1-R2) SSR: 회귀방정식에 의해 설명되는 변동(편차) SSE: 회귀방정식에 의해 설명되지 않는 변동(편차) - 공식요약: 적합도 R2 = SSR/SST = 1 - SSE/SST = 두 변수간 상관계수 r을 제곱한 값 R2의 특징: 결정계수가 1에 가까울수록 추정된 회귀식의 적합도가 높다 - 적합도를 측정하는 또 다른 방법: 추정된 표준오차 측정 종속변수의 실제값과 추정값의 차이를 제곱하여 합한 것을 자유도 n-2로 나눈 것을 제곱근한 것 => 종속변수의 실제값이 회귀식에 의해 추정한 값과 유사할수록 표준오차 값이 작아져 회귀식에 적합도가 높아짐. ② 회귀방정식의 유의성 검정: 분산분석 - 회귀모형의 유의성 검정 독립변수가 종속변수에 대해 의미를 갖는지 검정하는 것 - 단순회귀방정식에서는 β이 0이인지 아닌지 가설을 설정함. 귀무가설: β = 0, 대립가설: β ≠ 0 - 검정도구: F검정 임계값: F(1, n-2, α) 검정통계량: F(1,n-2) = MSR / MSE
③ 회귀계수의 유의성 검정 - 절편계수에 대한 유의성 검정 가설설정: 귀무가설 H0: α = 0 , 대립가설 H1: α ≠ 0 검정도구: 표본절편계수 a의 분포에서 t검정 이용 - 기울기계수에 대한 유의성 검정 가설설정: 귀무가설 H0: β = 0 , 대립가설 H1: β ≠ 0 검정도구: 표본회귀계수 b의 분포에서 t검정 이용
03. 다중회귀분석 (여기서는 2개의 독립변수 가정) 1) 회귀방정식 ① 백화점의 매출에 영향을 미치는 독립변수 매장넓이, 주차면수, 경쟁업체수, 홍보, 주민수등~~~ ② 회귀모형: 확률적 관계를 식으로 나타낸 것 yi = α + β1x1 + β2x2 + εi 오차항 εi: 평균0, 분산이 σ2인 정규분포 한다. α 와 β : 모집단 회귀방정식의 회귀계수로서 상수임. ※ 공식요약: 회귀모형의 기본가정 - 오차항 εi는 평균이 0인 정규분포를 한다. - 오차항 εi는 모든 xi에 대하여 동일한 분산, 즉 등분산을 가진다 - 오차항 εi는 서로 독립적, 즉 비자기상관(no autocorrelation)이다 ③ 회귀방정식: 독립변수 X에 대한 종속변수 Y값 분포의 기대값 E(yi) = α + β1x1 + β2x2 Var(yi) = σ2 => 함수관계를 의미 ④ 표본회귀모형: 모집단회귀모형과 모집단회귀방정식을 추정하기 위한 식 yi = a + b1x1 + b2x2 + ei 잔차 (residuals) ei : 오차항 εi 의 추정치 실제의 표본관찰값과 예측된 값과의 차이 ⑤ 표본 자료에 가장 적합한 표본회귀식 구하기 ∑ei2를 최소화하는 최소제곱법으로 직선으로 구함. ei = yi - ( a + b1x1 + b2x2) 2) 적합도와 유의성 검정 ① 다중공선성(multicolinearity) 여러 개의 독립변수간 높은 상관관계(상호의존성)으로 회귀계수값이 왜곡되어 나타날 가능성 ② 다중공선성을 알아보는 방법 - 독립변수들간 상관관계 분석 - 분산팽창계수(VIF: Variance Inflation Factor)
|