통계란?
분석하고자 하는 특정집단을 대상으로 수행한 조사나 실험을 통해 얻은 자료 및 요약된 형태의 표현
모집단: 해당 정보에 대한 대상
통계 자료 획득 방법:
- 전수조사: 대상 집단 전원 조사.
- 표본조사: 모집단을 대표할 수 있는 표본을 추출하여 조사
표본 추출 방법
단순 랜덤 추출법
모집단에서 n개의 표본을 추출할 때 임의로 선택해 표본으로 한다.
계통 추출법
일정한 개수의 구간으로 분리한다. 각 구간에서 1명씩 뽑아 표본을 추출한다.
집락(군집) 추출법
모집단이 몇 개의 집락이 결합된 형태로 구성되어있고, 각 집단에서 원소들에게 번호를 부여할 수 있는 경우에 이용된다. 집락끼리 동질적인 부분이 있어 일부 집락을 랜덤으로 선택해 선택된 각 집단에서 표본을 임의 선택
충화 추출법
이질적인 모집단의 원소들을 유사한 것끼리 몇 개의 층으로 나눈 후, 각 층에서 표본을 랜덤하게 추출한다.
비례 충화 추출법: 전체 데이터의 분포를 반영하여 각 집략별 데이터를 추출하는 방법(각 층의 인원 비율에 따라 그 비율만큼 표본 추출)
불비례 충화 추출법: 전체 데이터 분포 상관없이 각 집락에서 원하는 개수의 데이터 추출

측정과 척도
측정: 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하도록 관측해 자료를 얻는 것
척도: 관측 대상의 속성을 측정하여 그 값이 숫자로 나타나도록 일정한 규칙을 바꾸는 도구
질적 척도
- 명목척도: 측정 대상의 집단 분류(성별, 출생지, 학교 등)
- 순서척도(서열척도): 측정 대상이 가지는 서열관계(선호도, 신용도, 학년, 순위 등)
양적 척도
- 구간척도(등간척도): 측정 대상이 갖고 있는 속성의 양 측정, 구간 사이 간격이 의미가 있음(온도, 지수 등)
- 비율척도: 절대적인 기준 0값이 존재하고, 사칙연산이 가능함(무게, 키, 나이 등)
통계분석
기술통계
얻어진 데이터에서 특징을 뽑아내기 위한 기술
정리, 요약하는 기초 통계
숫자: 평균, 표준편차, 중위수, 최빈값, % 등
그림: 막대그래프, 원그래프, 꺾은선그래프 등
추리통계/통계적 추론
통계학과 확률이론의 혼합으로, 전체를 파악할 수 없는 큰 대상 또는 미래의 일 추측
수집된 자료를 이용해 대상 집단에 대해 의사결정
모수추정, 가설검증, 예측
기초 통계 용어
| 자료(데이터) | |
| 평균(기대값) | 일반적으론 산술평균 |
| 표본평균 | 모집단에서 추출한 표본들의 평균 |
| 중앙값 | 자료를 순차나열했을 때 가운데 위치한 값 |
| 최빈값 | 데이터 집합에서 가장 빈번하게 나타나는 값 |
| 분산 | 데이터의 흩어진 정도를 나타내는 통계적 측도 |
| 표준편차 | 분산의 양의 제곱근 |
| 백분위수 | 데이터 순차정렬했을 때 백분율 위치의 데이터값으로 범위 파악 |
| 첨도 | 자료가 평균에 얼마나 많이 밀집해있는지의 측도 |
| 왜도 | 확률분포의 비대칭도를 측정하는 통계적 측도 |
| 상관분석 | 두 변수가 함께 움직이는 방향과 그 크기(공분산과 상관계수 활용도 함) |
| 공분산 | 두 변수 간의 상관 관계를 나타내는 통계적 측도 |
| 상관계수 | 두 변수 간의 선형 관계의 강도와 방향을 나타내는 통계적 측도 |