본문 바로가기

스터디스터디/경영통계학

기술통계학 - 자료의 종류와 형태

최초 작성일: 25.09.14

최종 작성일 : 25.09.14

 

1절 질적 자료와 양적 자료

1.1 질적 자료

속성인 사람, 개체, 조건, 상황들에 대해서 조사를 해서 만들어진 집합

조사는 관찰이나 실험을 통해서 얻을수 있음

관찰치 또는 측정치 들의 집합

기본단위(elementary unit) : 자료가 수집되는 관찰 대상(항목)을 말하는 데 관찰 단위(observation unit) 라고도 함

질적 변수 인종, 성별, 종교, 직업, 계급, 예/아니로, 학년 등과 같이 그 속성을 수치 척도로 측정할 수 없는 변수
질적 자료 질적 변수의 값들을 관찰하여 얻는 자료
정성적 자료 또는 범주 자료(category data) 라고도 표현함
 

※ 질적 자료는 통계분석을 위해 수치로 전환시키는 척도를 이용하여 양적 자료로 변환 시켜야 함

1.2 양적 자료

양적 변수  판매량, 환율, 타율, 지지율 등과같이 그 속성을 수치척도로 측정할 수 있는변수   
양적 자료 양적변수의 값들을 측정하여 얻은 자료
정량적 자료 또는 수치 자료(numerical data) 라고 함 

2절 이산 자료와 연속 자료

2.1 이산자료

이산자료 (discrete data) 학생수, 과목 수, 학점 수 등과 같이 하나하나 셀 수 있는 정수값을 취하는 이산변수의 값들을 관찰하여 얻는 자료 
이산적 변수 각 세대의자녀수나 자동차의 판매대수 처럼 정수값을 취할 수 있는 변수 

2.2 연속자료

연속자료 키, 무세, 온도 등과 같이 측정할 수있고, 연속적인 모든 실수값을 취할 수 있는 연속변수의 값들을 측정하여 얻는 자료  
연속적 변수 길이, 무게, 온도변화와 같이 연속적인 실수 값을 취할 수있는 변수   

※ 이산자료 사이 : gap 있음 / 연속자료 사이 : gap이 존재하지 않

2.3 단 변수 자료와 다 변수 자료

단변수 자료 (univariate data) 관찰대상이 되는 기본단위가 하나의 변수만을 갖고 이에 관해 자료 측정
양변수 자료 (bivariate data) 두개의 변수를 갖는 기본단위에 관해 자료 측정
다변수 자료 (multivariate data) 여러개의 변수를 갖는 기본단위

※ 단변수 자료는 변수가 한개이기 떄문에 자료의 대표치, 기본 단위들의 동질성, 이상치의 존재 여부 등에 관해 특성을 요약하는분석방법이 사용됨  

3절 명목, 서열, 구간, 비율 자료

3.1 명목 자료

척도(scale) : 사물의 속성을 구체화하기 위한 측정의 단위

명목 척도 (nominal) 측정대상을 상호배타적인 범주나 종류에 따라 분류할 수 있도록 그 측정대상에 부호 또는 수치를 부여하는 방법을 가짐  
명목 자료 명목척도로 측정한 자료
  • 숫자는 관찰대상을 서로 구별하기 위해 임의로 선택한 부호일 뿐 논리적 순위를 의미하지 않음
  • 명목자료는 각 변수의 도수나 백분율을 계산하는 정도의 분석만 가능함

3.2 서열 자료

서열 척도 (ordinal) = 명목척도 + 순위 명목척도와 같이 측정대상을 서로 구분할 수 있도록 상호배타적인 범주로 분류하지만 각 범주에 크기나 중요성에 따라 측정결과의 서열순서를 매겨주는것으로 순위 척도라고  
서열 자료 서열 척도로 측정한 자료
  • 숫자 간의 거리(차이)는 무의미하고 또한 원점(0)이 존재하지 않음
  • 한 학급에서 학생의 성적을 제일 잘한 학생부터 1등, 2등, 3등으로 등위가 매겨진 자료
서열변수 측정대상 간의 크고 작음, 높고 낮음 등의 순서를 부여하는 변수  
서열변수의 자료 사칙연산이 포함되는 분석은 불가

 

3.3 구간 자료 ( 명목 + 서열 + 산술)

▶구간 척도 또는 등간척도(interval scale)

- 측정대상을 범주에 따라 분류하고 여기에 서열 순서를 매겨준다는 점에서 서열척도와 같음

-서열을 나타내는 숫자 간의 간격이 산술적 의미를 갖는 다는 점에서 서열척도와 다름

▶ 구간자료 또는 등간 자료

-구간 척도를 측정한 자료

▶측정대상의 순서 뿐만 아니라 순서 사이의 간격을 알 수 있는 변수로 온도, 지능지수 등의 변수를 의미함

-온도가 섭씨 0도, 10도, 20도라고 할때 0도를 기준으로 20도가 10도보다 2배 덥다고 할 수 없는데, 이는 섭씨를 화씨로 전환하면 10도는 화씨 50도이며, 20도는 화씨 68도 이기 때문

▶측정대상의 상대적크기와 차이를 측정하기 위해 순위 사이의 균일한 간격을 사용하게 됨

▶ 구간자료에 대해서는 사칙연산 계산이 가능함 

 

3.4 비율 자료

▶비율철도(ratio)

-명목척도, 서열척도, 구간척도가 갖는 특성을 포함하는데 절대적 원점을 갖기 때문에 이 척도는 상대적 크기의 비교는 물론 절대적 크기의 비율을 반영함

등간 변수 비율 변수
0은 단순히 상대적인 위치를 나타냄 0은 절대적인 위치를 나타내고 있음

▶바율 자료

-비율 척도로 측정한 자료

예) 시간, 길이, 질량, 무게, 용돈, 농구게임 점수 등

  똑같 변수라 하여도 연구의 목적에 따라 변수의 수준을 달리하여 사용할 수 있음

 

3.5 자료의 비교

▶변수의 수주이 높은 것은 낮은 것으로 변환될 수 있으나 그 반대는 가능하지 않음

- 비율변수 -> 명목, 서열변수 등으로 가능함

-서열변수를 등간 또는 비율변수로 사용될 수 없음 

▶ 변수의 수준에 따라 변수에 대한 통계적처리 방법이 결정됨  

등간 및 비율변수 명목 및 서열 변수
대부분의 통계적 처리를 해도 변수의 성격이 달라지지 않음 여러가지 통계적 처리에서 제한을 받음

 

 

=sum-up

1. 질적 자료와 양적 자료

질적 변수는 인종, 성별, 종교, 직업, 계급, 예/아니오, 학년등과 같이 그 속성을 수치 척도로 측정할 수 없는 변수를 말한다

양적변수는 판매량, 환율, 타율, 지지율 등과 같이 그 속성을 수치척도로 측정할 수 있는 변수를 말한다

2. 이산 자료와 연속 자료

이산적 변수는 각 세대의 자녀수나 자동차의 판매대수 처럼 정수 값을 취할 수 있는 변수를 의미한다

연속적 변수를 길이, 무게, 온도 변화와 같이 연속적인 실수값을 취할 수 있는 변수를 말한다   

3. 명목, 서열, 구간, 비율 자료

명목척도란 측정대상을 상호배탁적인 범주나 종류에 따라 분류할 수 있도록 그 측정대상에 부호또는 수치를 부여하는 방법이다

서열척도는 명목 척도와 같이 측정대상을 서로 구분할 수 있도록 상호배타적인 범주로 분류하지만 각 범주에 크기나 중요성에 따라 측정 결과의 서열순서를 매겨주는것으로 순위척도라고 한다

구간척도 또는 등간척도는 측정대상을 범주에 따라 분류하고 여기에 서열 순서를 매기는 점에서 서열척도와 같지만, 서열을나타내는 숫자간의 간격이 산술적 의미를 갖는다는 점에서 서열척도와 다르다

비율척도는 명목척도, 서열척도, 구간척도가 갖는 특성을 포함하는데 절대적 원점을 갖기 떄문에 이 척도는 상대적 크기으 ㅣ비료는 물론 절대적 크기의 비율을 반영한다