3과목 데이터 분석

존재하지 않는 데이이터를 대치

age 수치형변수  -회귀분석 / survived - 범주형범주 - 분류형분석

 

평균이 중앙 값보다 크면 왜도 > 0

다중회귀                                                                                                                          다항회귀
수정된 R스퀘어 값은 다중회귀는 일반 R스퀘어에서는 모델이 일그러지기 쉬워서 사용한다.

 

자유도

E는 자유가 없으므로 5-1 = 4가 되는 것이다.
모형이 유의미한지 볼 때는 F검정 사용

만약 x값이 둘 다 0이라면 귀무가설은 기각되어야 한다.

 

회귀계수가 0이 아니면 각각에 대해서 t검정을 수행한다. 이 떄는 회귀계수가 0이냐는 t검정을 수행하고

이제 회귀계수를 수행한다.

 

 

f검정의 p - value - 신뢰도는 보통 95%

 

다변량분석

+ Recent posts