Statistics
Last updated
Last updated
๋ณ์๊ฐ์ ์๊ด๊ด๊ณ ์ฌ๋ถ
์ด๋คํํ์ ์๊ด๊ด
ํฌ์ํ ๊ด๊ณ ๋น์ฉ์ ๋ํด ๋งค์ถ์ก์ด ์ผ๋ง๋ ์ฆ๊ฐํ๋์ง ์์๋ณด๊ณ ์ ํ ๋ , ๊ทธ๋ฆผ1์ ๊ธฐ์ค์ผ๋ก ๊ด๊ณ ๋น์ฉ์ด ์ฆ๊ฐํ ๋ ๋งค์ถ์ก๋ ์ฆ๊ฐํ๋ค๋ ๊ฒ์ ์ ์ ์๋ค. ์ฆ ์ ๋น๋ก์ ์ธ ๊ด๊ณ๋ฅผ ํ์ธํ ์ ์๋ค.
:๋ ๋ณ์๊ฐ ์ ํ๊ด๊ณ์ ๊ฐ๋๋ฅผ ๋ํ๋ด์ฃผ๋ ์ฒ๋
๋ถ์๋ : ๊ณต๋ถ์ฐ (Cov) : ๊ฐ๊ฐ์ ํ๊ท ์ผ๋ก ๋ถํฐ ๋์์ ์ผ๋ก ๋ณํํ๋ ์ ๋
๋ถ๋ชจ๋ ๊ฐ๊ฐ x์ y๊ฐ์ ํธ์ฐจ ๋ฅผ ์๋ฏธํ๋ค.
-1<= r<=1 : 1์ ๊ฐ๊น์ธ ์๋ก ์์ ์ ํ๊ด๊ณ , -1 ์ ๊ฐ๊น์ธ ์๋ก ์์ ์ ํ๊ด๊ณ
0<=|r|<=1 : ์ ๋๊ฐ์ด 0์ ๊ฐ๊น์ธ์๋ก ์๊ด๊ด๊ณ๊ฐ ์๋ค, ์ ๋๊ฐ์ด 1์ ๊ฐ๊น์ธ ์๋ก ๊ฐํ ์๊ด์ฑ์ด ์๋ค.
ํ๊ท๋ถ์์ ๋ชฉ์ : ์์ธก(Prediction)๊ณผ ์ถ์ (estimation )
์ถ์ ์ B(k=1,2,3,...) ๋ฒ ํ K๋ค์ ๊ณ์๋ฅผ ์์๋ณด๋ ๊ฒ.
์์ธก์ ์๋ก์ด ๋ฐ์ดํฐ๊ฐ ๋ค์ด์์ ์, ์ผ๋ง๋ y๊ฐ์ ์์ธกํ๋ ๊ฒ
๋ธ๋ก๊ทธ ์์ ๋ฅผ ํตํด ์์ธํ ์ค๋ช (y์ ํธ B0 , B1: ๊ธฐ์ธ๊ธฐ , ์ต์์์น๋ฒ์ ํตํด ๊ตฌํ๋ค๋ ์ ๋๋ง )
ํ๊ท๊ณ์(regression coeficient ) ์ ์ ํ ๊ฒฐํฉ์ผ๋ก ํํ๋๋ ์์ธก๋ชจํ
๋ ๋ฆฝ๋ณ์(X) = ์ค๋ช ๋ณ์ , ์์ธ๋ณ์
์ข ์๋ณ์ (Y)= ๋ฐ์๋ณ์ , ํ๊ฒ ๋ณ
๊ฐ์ : ๊ฐ๊ฐ x์ y๋ ์ ํ์ ์ธ ๊ด๊ณ๊ฐ ์๋ค
ํ๊ท์์ด ๋ฐ์ดํฐ์ ์ค๋ช ํ๋ ๋ํ ์ฒ๋๋ก, ํ๊ท๋ชจํ์ผ๋ก ์ค๋ช ๊ฐ๋ฅํ ๋น์จ์ ๋งํจ (์ฌ๋ฌ ๋ ๋ฆฝ๋ณ์๋ค์ด ์ข ์๋ณ์๋ฅผ ์ผ๋ง๋ ์ค๋ช ํ๋์ง?)
๊ฒฐ์ ๊ณ์ ๋ฒ์ : 0<=R^2 <=1
๊ฒฐ๊ตญ, ์ ์ฒด ๋ถ์ฐ(SST) ์์ ๋์ ํ๊ท๋ชจํ์ ์ค๋ช ๋ ฅ(SSR)์ ๊ตฌํ๋ ๊ฒ = ์ ์ฒด 1์์ ์ค์ฐจ(SSE)/๋ถ์ฐ(SST)๋ฅผ ๋บ