Statistics
Last updated
Last updated
변수간의 상관관계 여부
어떤형태의 상관관
투자한 광고비용에 대해 매출액이 얼마나 증가했는지 알아보고 자 할 때 , 그림1을 기준으로 광고비용이 증가할때 매출액도 증가했다는 것을 알 수 있다. 즉 정비례적인 관계를 확인할 수 있다.
:두 변수간 선형관계의 강도를 나타내주는 척도
분자는 : 공분산 (Cov) : 각각의 평균으로 부터 동시적으로 변화하는 정도
분모는 각각 x와 y간의 편차 를 의미한다.
-1<= r<=1 : 1에 가까울 수록 양의 선형관계 , -1 에 가까울 수록 음의 선형관계
0<=|r|<=1 : 절대값이 0에 가까울수록 상관관계가 없다, 절대값이 1에 가까울 수록 강한 상관성이 있다.
회귀분석의 목적 : 예측(Prediction)과 추정(estimation )
추정은 B(k=1,2,3,...) 베타 K들을 계수를 알아보는 것.
예측은 새로운 데이터가 들어왔을 시, 얼마나 y값을 예측하는 것
블로그 예제를 통해 자세히 설명 (y절편 B0 , B1: 기울기 , 최소자승법을 통해 구한다는 정도만 )
회귀계수(regression coeficient ) 의 선형 결합으로 표현되는 예측모형
독립변수(X) = 설명변수 , 원인변수
종속변수 (Y)= 반응변수 , 타겟 변
가정: 각각 x와 y는 선형적인 관계가 있다
회귀식이 데이터의 설명하는 대한 척도로, 회귀모형으로 설명 가능한 비율을 말함 (여러 독립변수들이 종속변수를 얼마나 설명하는지?)
결정계수 범위 : 0<=R^2 <=1
결국, 전체 분산(SST) 에서 나의 회귀모형의 설명력(SSR)을 구하는 것 = 전체 1에서 오차(SSE)/분산(SST)를 뺀