기술통계
자료의 특성을 표, 그림, 통계량 등으로 쉽게 정리/요약하는 것.
데이터 분석 전 대략적인 통계적 수치를 계산해보면 분석의 통찰력을 얻을 수 있다.
- 히스토그램: 연속된 수치 구간의 막대 그래프
- 막대그래프
- 줄기-잎 그림
- 상자그림(상자수염그림)
인과관계의 이해
종속변수(y): 다른 변수에 영향을 받는 변수
독립변수(x): 다른 변수에 영향을 주는 변수
산점도: 두 변수 간의 관계를 시각적으로 나타내는 그래픽 표현 방법 중 하나
t-검정
일 표본 t-검정
한 집단의 평균이 어떤 특정한 값과 차이가 있는지 검정
특정 가설을 확인하거나 평균이 기대값과 일치하는지 여부 평가에 사용
단측 검정은 두 그룹에 관계에서 특정 방향으로 평균의 차이가 있는지 검정하는 통계적 방법
대립가설이 한 방향으로 특정되어있을 때 사용
양측 검정은 모수값이 ~이다/~가 아니다처럼 방향성이 없는 경우에 수행되는 검정 방법
주로 두 집단의 평균이 서로 다르다는 것을 확인할 때 사용
이(독립) 표본 t-검정
독립된 그룹 간에 평균 차이가 있는지를 검정하는 통계적 방법
두 그룹이 독립되어있고, 각각 그룹의 관측치들이 서로 영향을 미치지 않는 경우에 사용.
두 그룹의 분산이 같음을 의미하는 등분산성을 만족해야 하므로 이 표본 t-검정을 수행하기 전에 등분산 검정(F 검정)을 먼저 수행
단측 검정은 두 그룹 사이에서 대소가 있는 경우 수행되는 방법
양측 검정은 두 그룹이 같다 또는 다르다의 대소가 없는 경우 수행되는 방법
대응 표본 t-검정
동일한 대상에 대해 두 가지 관측지가 있는 경우 비교하여 차이가 있는지 검정할 때 사용
실험 전후의 효과 비교에 주로 사용
두 변수 간의 변화가 우연인지, 특정 처리나 조건에 의해 유발된 것인지 알 수 있다.