최초 작성일: 25.10.10
최종 작성일: 25.10.10
1절 확률변수의 기댓값과 분산
1.1 기댓값의 의미
- 확률변수의 확률분포가 작성되면 확률변수가 취할 수 있는 모든 값들의 평균값인 기댓값을 구할수 있음
- 기댓값은 확률분포에서 분포의 무게중심을 말하며 실험을 수없이 반복할 때 그 확률변수가 갖는 장기적 평균이라고 해석할 수 있음
- 확률변수의 기댓값을 구하는 공식은 이산변수와 연속변수가 서로 다름
1.2 기댓값 공식
- 확률변수 X의 확률변수가 f(X)일때 변수 X의 기댓값
- 확률변수가 취할 수있는 값에 대응되는 확률을 가중치로 하는 확률변수의 가능한 모든 값들의 가중평균이라고 할 수 있
- 확률변수 X의 기댓값 E(X)를 알고 있다면 확률변수 X를 1차식으로 표시할 수 있는 다른 확률변수의 기댓값도 쉽게 구할 수 있
1.2 기댓값의 특성
- 기댓값의 연산
- 확률변수X 에 일정한 상수 a를 곱한 확률변수의 기댓값은 확률변수 X의 기댓값에 a를 곱한것과 같음
E(aX) = aE(X) - 확률변수X에 일정한 상수 b만큼을 더한 확률변수의 기댓값은 확률변수X의 기댓값에 b를 더한것과 같음
E(X+b) = E(X) +b E(X-b) = E(X) -b - 두가지 결과를 결합하면 다음의 식이 성립됨
E(aX + b) = aE(X)+b - 다양한 기댓값의 특성
E(a) =a
E(aX) = aE(X)
E(a+bX) = a + bE(X)
E(X+Y) = E(X) +E(Y)
E(aX+bY) = aE(X) +bE(X)
- 확률변수X 에 일정한 상수 a를 곱한 확률변수의 기댓값은 확률변수 X의 기댓값에 a를 곱한것과 같음
1.3 분산
- 확률변수의 분포를 분석하기 위해서는 기댓값과 함께 분산을 계산해야함
-비록 기댓값이 같더라도 분산이 다른 두개의 분포가 있을 수 있기 때문
기댓값 | 확률실험이 반복되는 경우에 확률변수가 취하는 값들의 평균을 제공 |
분산 또는 표준편차 |
확률변수의 기댓값을 중심으로 얼마나 흩어져 있는가는 나타내는 산포도의 측정치 |
1.4 분산과 표준편차의 연산
- 어떤 확률변수(random variable)의 분산 또는 표준편차가 결정되면, 이 확률변수와 1차식의 관계를 갖는 다른 확률변수들의 분산과 표준편차는 다음의 특성을 이용하면 쉽게 구할 수 있음
-어떤 확률변수에 일정한 상수를 더한 확률변수의 분산은 본래의 확률 변수의 분산은같음
-확률변수에 상수를 더한 것은 본포의 분산도에는 아무런 영향을 미치지 못하기 때문
-어떤 확률변수에 일정한 상수a를 곱한 확률변수의 분산은 본래의 확률변수의 분산에 a제곱를 곱한 것과 같음
2절 결합확률분포
2.1 결합확률분포의 개념
- 단일 확률변수의 확률분포는 그 변수의 확률함수를 이용하게 됨
- 하지만, 현실적으로 두 개 이상의 변수가 서로 연관되어 영향을 미치는 상황이 일반적
-광고비의 수준이 매출액 증대에 영향 - 결합확률분포 : 둘 이상의 확률변수가 서로 연관된 확률분포
- 결합확률분포는 연관된 두 확률변수 X와 Y의 값의 모든 쌍에 대해 결합확률을 대응 시킨 표를의미함
- 결합확률분포는 분할표를 이용하는 것이 일반적 형태
-결합확률분포가 작성되면 주변확률분포를 구할 수 있음
-주변확률은 각 개별변수 X와 Y의 확률로서 결합확률분포료의 가장자리에 나타남
-결합확률분포표에서 각 행의 합은 확률변수 X의 주변확률분포를 나타내고, 각 열의 합은 확률변수 Y의 주변확률분포를나타냄-> 그림1 참고
-두 확률변수의 개별확률분포가 표의 주변에 나타나므로 X와 Y의 개별확률분포를 주변확률분포라고 함
2.2 조건확률
- P(B|A)는 사상A가 이미 발생하였다는 조건 하에서 사상 B가 발생할 확률을 의미함
- 두 변수 간의 조건확률은 동일하며 P(Y|X) =P(X ∩ Y)/P(X)
2.3 두 변수의 독립성
- 두 변수 간의 독립성은 한 변수가 어떤 값을 취하든 이 값이 다른 변수가 어떤 특정한 값을 취할 확률에 전혀 영향을 미치지 않는다면 두 변수는 독립적이다라고 말함
- 두 변수 간의 독립성 조건
- 두개의 확률변수 X와 Y가 독립적이면 다음조건이 성립됨
P(X =x | Y=y) = P(X=x)
P(Y=y | X=x) = P( Y=y )
3절 공분산과 상관계수
3.1 공분산
- 통계적으로 종속적인 두 확률변수 X와 Y가 있을 때 두 변수 사이 연관 관계의 강도와 성격을 측정할 필요가 있음 (예) X= 키 <> Y=몸무게
- 두 변수의 관계가 직선으로 나타낼 수 있는 선형관계라고 한다면 X의 큰 값이 Y의 큰 값에 대응하고 X의 작은 값이 Y의 작은 값에 대응할 때 [X-E(Y)][Y-E(Y)]는 양수가 되고, 두 변수의 관계는 강하게 됨
- 두 변수 사이가 독립적이라서 선형관계가 아니라면
[X-E(X)][Y-E(Y)] = 0
- 공분산은 두 확률변수의 분포가 결합될 때 그 결합확률분포의 분산을 측정함
(예) 매출액은 광고비의 지출과 밀접합 관계를 가지고 있고, 이 두 변수 사이의 비례, 반 비례의 관계를 밝히는 것은 통계분석에 유용함 - 공분산은 분산σ제곱과 비슷하게 계산되지만 분산과 달리 음수의 값을 가질 수 있음
- 공분산이 양수이면 두 확률변수가 같은 방향으로 함께 움직이고, 음수이면 두변수가 반대방향으로 움직이는 것을 의미함
- 공분산은 두 변수의 선형관계를 밝혀주지만 그의 크기는 두 변수의 선형관계의 강도를 나타내는 지표는 아님
-> 그의 크기가 두 변수의 측정단위에 의존하기 때문
-만일 X의 단위가 m제곱이고 y의 단위가 100원일때의 공분산과 X의 단위가 cm제곱이고 y단위가 100월일때의 공분산은 크기에 있어 차이가 있음 - 공분산은 두 확률변수 X와 Y의 선형관계의 여부를 규명하지만 두변수 X와 Y의 측정 단위에 따라 그의 값이 달라지므로 두 변수 사이 연관관계의 강도를 나타내주지 못함
3.2 상관계수
- 단위에 관계없이 두변수 X와 Y 사이의 밀접한강도를 측정하기 위해서는 X와 Y의 공분산을 X의 표준편차와 Y의 표준편차로 나누는데 이 값을 모집단 상관계수(Correlation Coefficient) 또는 X와 Y의 상관계수라고 함
- 상관계수는 두 변수의 관계가 직선관계이고 완전한 비례관계이면 +1의 값을 갖게 되지만, 완전한반비례의 관계이면 -1의 값을 가지게 되므로 상관계수는 -1~+1 사이의 값을 갖게 됨
- 상관계수의 값이 0이면 두 변수 사이에 아무런 관계가 없음을 의미함
- 상관계수의 부호와 크기는 두 변수 X와 Y 사이에 존재하는 관계의 방향과 강도를 나타냄
'스터디스터디 > 경영통계학' 카테고리의 다른 글
이산확률분포 - 이항분포의 형태 (1) | 2025.10.13 |
---|---|
확률변수와 확률분포의 의미 (0) | 2025.10.09 |
확률이론 - 집합과 확률이론 (0) | 2025.10.05 |
기술통계학(요약 통계량) - 상대위치 및 형태의 측정 (0) | 2025.09.29 |
기술통계학(요약 통계량) - 중심경향 및 산포도 (1) | 2025.09.23 |