프로그램_시스템/데이터

[ADsP] 통계 분석의 이해

9191 2026. 6. 1. 16:56
통계란?

 

분석하고자 하는 특정집단을 대상으로 수행한 조사나 실험을 통해 얻은 자료 및 요약된 형태의 표현

 

 

모집단: 해당 정보에 대한 대상

 

통계 자료 획득 방법:

  • 전수조사: 대상 집단 전원 조사.
  • 표본조사: 모집단을 대표할 수 있는 표본을 추출하여 조사

 

 

표본 추출 방법

단순 랜덤 추출법

모집단에서 n개의 표본을 추출할 때 임의로 선택해 표본으로 한다.

 

계통 추출법

일정한 개수의 구간으로 분리한다. 각 구간에서 1명씩 뽑아 표본을 추출한다.

 

집락(군집) 추출법

모집단이 몇 개의 집락이 결합된 형태로 구성되어있고, 각 집단에서 원소들에게 번호를 부여할 수 있는 경우에 이용된다. 집락끼리 동질적인 부분이 있어 일부 집락을 랜덤으로 선택해 선택된 각 집단에서 표본을 임의 선택

 

충화 추출법

이질적인 모집단의 원소들을 유사한 것끼리 몇 개의 층으로 나눈 후, 각 층에서 표본을 랜덤하게 추출한다.

 

비례 충화 추출법: 전체 데이터의 분포를 반영하여 각 집략별 데이터를 추출하는 방법(각 층의 인원 비율에 따라 그 비율만큼 표본 추출)

불비례 충화 추출법: 전체 데이터 분포 상관없이 각 집락에서 원하는 개수의 데이터 추출

https://specialscene.tistory.com/77

 

 

측정과 척도

측정: 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하도록 관측해 자료를 얻는 것

척도: 관측 대상의 속성을 측정하여 그 값이 숫자로 나타나도록 일정한 규칙을 바꾸는 도구

 

 

질적 척도

  • 명목척도: 측정 대상의 집단 분류(성별, 출생지, 학교 등)
  • 순서척도(서열척도): 측정 대상이 가지는 서열관계(선호도, 신용도, 학년, 순위 등)

 

양적 척도

  • 구간척도(등간척도): 측정 대상이 갖고 있는 속성의 양 측정, 구간 사이 간격이 의미가 있음(온도, 지수 등)
  • 비율척도: 절대적인 기준 0값이 존재하고, 사칙연산이 가능함(무게, 키, 나이 등)

 

 

통계분석

기술통계

얻어진 데이터에서 특징을 뽑아내기 위한 기술

정리, 요약하는 기초 통계

숫자: 평균, 표준편차, 중위수, 최빈값, % 등
그림: 막대그래프, 원그래프, 꺾은선그래프 등

 

추리통계/통계적 추론

통계학과 확률이론의 혼합으로, 전체를 파악할 수 없는 큰 대상 또는 미래의 일 추측

수집된 자료를 이용해 대상 집단에 대해 의사결정

모수추정, 가설검증, 예측

 

 

기초 통계 용어

자료(데이터)  
평균(기대값) 일반적으론 산술평균
표본평균 모집단에서 추출한 표본들의 평균
중앙값 자료를 순차나열했을 때 가운데 위치한 값
최빈값 데이터 집합에서 가장 빈번하게 나타나는 값
분산 데이터의 흩어진 정도를 나타내는 통계적 측도
표준편차 분산의 양의 제곱근
백분위수 데이터 순차정렬했을 때 백분율 위치의 데이터값으로 범위 파악
첨도 자료가 평균에 얼마나 많이 밀집해있는지의 측도
왜도 확률분포의 비대칭도를 측정하는 통계적 측도
상관분석 두 변수가 함께 움직이는 방향과 그 크기(공분산과 상관계수 활용도 함)
공분산 두 변수 간의 상관 관계를 나타내는 통계적 측도
상관계수 두 변수 간의 선형 관계의 강도와 방향을 나타내는 통계적 측도