본문 바로가기

스터디스터디/경영통계학

이산확률분포 - 이항분포의 형태

최초 작성일: 25.10.13

최종 작성일: 25.10.13

 

1절 베르누이 시행과 이항분포 정의

1.1 베르누이 시행

  • 표본공간이 두개의 원소로 구성된 실험을 하거나 표본을 추출할 떄 확률변수의 결과는 두개의 범주로 구분하는 경우가 있음
  • 범주는 상호배타적이며 실험의 어떤 결과 또는 관찰도 이들 범주의 하나에만 속하게 됨
    (예)
    질문의 예와 아니오의 답변, 제품의 양품과 불량품, 선거에서 당선과 낙선, 시험의 합격과 불합격  
  • 각 시행의 두개의 가능한 상호 배타적인 결과에서 성공과 실패로 간주한다면 이러한 실험의 관찰 또는 시행을 베루느이 시행이라고 함
  • 동전 던지기와  주사위 던지기와 같이 한 시행의 결과는 다른 시행의 결과의 확률에 영향을 미치지 않음

▶베르누이 시행의 조건

-각 시행은 성공(S)이라는 결과와 실패(F)라는 다른 결과 등 두개의 상호 배타적인 결과를 가짐

-성공 확률 p = P(S)와 실패확률 q = P(F) =1-p 는 모든 시행에 있어 변함이 없기 때문에 각 시행해서 성공이 나타날 확률과 실패가 나타날 확률의 합은 p+q =1 이 됨

-각 시행의 결과는 서로 독립적이며, 시행 간에는 서로 영향을 미치지 않음

1.2 이항분포

1) 이항분포의 정의

  • 베르누이 시행의 조건 외에 동일한 시행을 n번 반복할 떄 특정 횟수의 성공확률에 관심이 있다면 이는 이항실험이라고 함
  • 이항실험과 관련된 이항확률변수 X는 베르누이 시행을 n번 반복했을 때 나타나는 성공횟수를 의미함
  • 이항변수 X는 모수 n과 p를 갖는  변수로서 n번 시행에서 나타난 성공횟수에 따라 0,1,2,n 등 정수값을 가질 수 있음
  • n번 던지는 동전의 경우 앞면이 나오면 성공이고, 뒷면이 나오면 실패라고 할 때 이항확률변수 X가 가질수 있는 최소값은 모두 뒷면이 나오는 경우의 0이 되며, 최대값은 모두 앞면이 나오는 경우의 n이 됨
     → 따라서 동전 던지기 실험에서 얻을 수 있는 이항확률변수의 값은 n번의 시행 중 성공하는 앞면의 수를 나타내는 데 이 때 그 앞면의 수가 나올 확률을 나타내는 분포를 이항확률분포라고 한다  

2) 이항확률 분포의 정의

  • 이항확률변수가 취하는 값들과 이에 대응하는 확률을 나타내는 분포
  • 이항분포는 관심있는 이산변수가 동일한 시행을 n번 반복할 때 나타나는 성공의 수라고 할 수 있음 

(예)

동전은 세번 던졌을 때 나타날 수 있는 가능한 모든 경우의 수는 8가지 이며 이중에서 한가지 경우가 나타날 가능성은 1/8

시행횟수 n 또는 성공확률 p 에 따라서 확률분포의 모양이 달라짐

 

3)이항확률질량함수의 이용

  • n과 p를 모수로 갖는 이항확률변수 X의 확률과 이항분포의 모양은 시행횟수 n, 성공횟수 x, 각 시행에서의 성공확률 p를 알면 규명이 가능함
  • 이항실험의 결과인 이항분포는 선험적인 분포로서 수십 차례, 수백차례에 걸친 베르누이 시행을 실제로 해보지 않더라도 시행횟수 n과 성공의 확률 p 값만 알고 있으면 그 분포의 모양과 확률변수의 확률을 알 수 있음

 

2절 이항확률표의 이용과 형태

2.1 이항확률표의 이용

  • 이항확률 함수를 이용하여 확률을 계산할 때 n기 커질수록 계산이 복잡하여 실수할 가능성이 높아지기 때문에 이런 경우 이항확률표를 이용하면 간단하게 계산할 수 있음
  • 확률함수를 이용할때와 동일하게 표를 이용하여 성공확률p, 시행횟수 n,성공횟수 x의 값이 필요함 

(예) 성공 확률 p = 0.15, 시행횟수 n=19, 성공횟수 x= 1 일때 확률은 0.1529

  • 이항확률표를 이용하여 누적확률을 구할 수 있음
  • 특정  성공횟수 이상, 이하, 초과, 미만 등의 확률을 구할 수있음 

(예)
성공확률 p= 0.45이고 시행횟수 n= 5,성공횟수가 x=2 이하일때

p(x<2) = p(0) + p(1) + p(2)

성공횟수가 x=3이상일때

1- P(X<=2) = 0.4069

 

2.2 이항분포의 형태

  • 이항분포의 형태는 모수인 성공확률 p와 시행횟수 n에 따라 결정됨
  • 일반적으로 p가 0.5에 가까울수록 또는 n이 증가할 수록 이항확률분포를 종모양의 정규분포에 근접함
  • 반대로 p가 매우 크거나 작을경우, 또는 n이 작을 수록 이항분포는 한쪽으로 매우 치우친 분포를 보여줌

3절 이항분포의 기대값과 분산

  • 확률분포의 기대값과 분산의 식에 이항분포의 확률변수와 확률값을 대입해서 이항분포의 기대값과 분산을 구할 수 있음