본문 바로가기

스터디스터디/경영통계학

[WIP]통계적 추정 - 한모집단 (1/2)

최초 작성일: 25.11.17

최종 작성일: 25.11.17

 

1절 점추정과 구간 추정의 의미

1.1 개념

  • 알지 못하는 모수의 값(모수치)을 추정한다는것은 그 모집단에서 랜덤으로 추출하여 얻는 표본통계량으로 모수를 예측함을 의미함   
  • 추정량과 추정치
    • 모수의 추정량 : 표본 정보에 의존하는 확률변수로서 모수를 추정하는데 사용되는 표본 통계량(표본평균, 분산,비율)
    • 추정치 : 추정량으로 결정되는 특정 값
  • 미지의 모수를 추정하는 데 있어서 두 가지 가능한 방법을 고려해야함
    • 점 추정 : 표본으로부터 하나의 수치를 계산하여 모수를 추정하는 것
    • 구간 추정 :표본정보를 통해 미지의 모수에 대한 참값이 포함되리라 기대되는 어느정도 신뢰할 수 있는 구간으로 추정하는 것   
      • 구간이 클수록 그 정보의효과는 감소되며, 평균점수가 0~100점 사이에 있을 것이라 가정한다면 그 추정은 맞을 가능성이 100%이지만 정보가 주는 가치는 하나도 없게 된다
    • 점 추정은 모수와 같을 가능성이 가장 높은 하나의 값만을 선택하는 것이므로 아무리 가능성이 높은 값을 점 추정치로 사용한다 하여도 그 값이 완전히 옳다고 확신하기가 어려움   
    • 점 추정의 큰 단점은 추정에 대하여 불확실성의 정도를 표현하지 못하여, 표본 오차 때문에 불확실성을 추정하는데 측정할 방도가 없음 - 이를 해결하기 위해 구간 추정을 사용함
    • 구간 추정은 표본의 통계량을 기초 모수가 존재할 일정구간을 추정하는 방법으로서 점 추정에비하여 더 많이 사용되는 통계적 추정방법 

2절 추정량의 결정기준

3절 신뢰구간 추정

3.1 개념

  • 점 추정치는 표본에 따라 계속 달라지고 표본오차 떄문에 모수와 일치하기가 어려움
  • 구간추정은 모수가 포함되리라고 보는 범위(구간)를 원하는 만큼의 정확도를 가지고 제시함으로써 추정치에 대한 불확실성을 표현함
  • 점 추정치를 중심으로 하한부터 상한 까지의 구간은 신뢰구간이라고 함
    • 하한 : 신뢰 하한/ 상한 : 신뢰상한 / 하한상한 : 신뢰한계 (Confidential Limits)
  • 신뢰 구간 : 특정확률로 모수가 포함될 것이라고 기대하는 범위(구간)
  • 모수의 참값이 두 신뢰한계 내에 포함될 것이라고 주장할 때 확률을 사용하는 데 이 확률은 신뢰수준 또는 신뢰도라고 함
  • 신뢰구간을 설정한다는것은 오차범위(한계)를 얼마로 정할 것인가를 의미함
  • 신뢰구간을 설정한다는 것은 오차범위(한계)를 얼마로 정할것인가를 의미함  
    • 오차범위 : 신뢰구간의 중심이 되는 점 추정치로부터 신뢰상한의 거리(폭) 
  • 신뢰구간을 결정할 오차범위는 다음과 같은 두 요인에 의존함
    • 표준오차
      • 표준오차가 클수록 신뢰구간은 넓어짐
      • 신뢰수준이 높을 수록 신뢰구간도 넓어짐
      • 신뢰구간이 넓을 수록 모수가 포함될 확률을 높게 되지만, 정보로서 가치는 상실됨 
      • 신뢰구간의 목적은 신뢰수준을 높게하고 신뢰구간은 좁게 하는 것
    • 오차율
      • 알파(유의수준, significatn )는 100%에서 신뢰수준을 뺀 값
      • 신뢰수준(1-알파)는 신뢰구간 속에 모수를 포함할 확률을 말하고 알파는 모수의 참값이 신뢰구간 밖에 존재할 확률을 말함
      • 알파는 구간 추정의 부정확도를 나타내므로 오차율이라고도 함
        • 즉 (1-알파)는 모집단의 모수가 신뢰구간 속에 포함될 확률을 의미하며, 이르 ㄹ신뢰도 또는 신뢰수준이라고 함
      • 오차율알파의 값과 신뢰구간 사이에는 반비례 관계가 있음
        • 표본크기 n이 일정한 경우 알파의 값이 작을수록(신뢰수준이 높을수록) 긴뢰수간의 폭은 넓어짐
        •   즉, 모수가 신뢰구간 안에 있을 확률은 신뢰구간 (1-알파)이며, 신뢰구간 밖에 있을 확률을 알파  

4절 모평균의 신뢰구간 : 모표준편차를 아는 경우 -> 여기서 부터 다시

  • 신뢰 구간을 설정할 때는 모수가 신뢰구간의 상한 또는 하한을 벗어나는 실수를 저지를 확률을 우선 결정해야함
  • 일반적으로 알파/2 씩으로 하며, 구간으로 모수를 추정함에 있어서 평균의 평균분포는 각 꼬리 부분에서 알파/2씩을 잘라내는 Z값을 찾아야함

 

 

 

 

5절 모평균의 신뢰구간 : 모표준편차를 모르는 경우

 

 

※ 들어가기 전에

좋은 추정량이 되기 위해서는 다음 조건을 갖추어야 함

  • 불편성 
    • 추정량의 기댓값이 추정할 모수의 실제값과 일치하거나 또는 그 값에 가까이 갈수록 바람직한 추정량이라고 할 수 있음
    • 만약 추정량의 기댓값이 실제 모수의 값과 차이가 나면 그 추정량의 편의(bias) 갖는다고 설명할 수 있음
    • 이상적인 추정량의 조건은 0의 편의를 가지는것
    • 좋은 추정량을 되기 위해서는 갖추어야 할 가장 중요한 조건은 불편성(unbianessed) 

  • 효율성
    • 좋은 추정량이 되기 위해서는 추정량의 기댓값이 모수의 값과 같을 뿐만 아니라 추정량의 분산이 작아야함
    • 모수 쎄타를 중심으로 표본에서 얻은 추정량 세트가 작은 분산으로 집중되어 있을때 효율적인 추정량이라 할 수 있음

 

  • 일치성
    • 표본의 크기 n이 무한히 증가하면 그 표본에서 얻은 추정량 쎄타 헷이 모수 쎄타에 일치되는 것
    • 표본의 크기가 커지면 커질수록 추정량과 모수 간의 차이는 차차 작아지게 되는 것을 말함

  • 충족성
    • 동일한 표본으로부터 얻은 추정량 쎄타 헷이 다른추정량보다 모수 쎼타에 관하여 가장 많은정보를 제공해 주고 있다면, 이 추정량은 쎄타 헷은 충족성이 있다고 할 수 있음