본문 바로가기

수학/확률과 통계

통계 확률변수와 확률분포

반응형

https://startagainbornagain.tistory.com/143

 

통계의 종류

통계는 크게 두 가지로 나눌 수 있습니다. 기술통계(학) : 우리가 흔히 아는 흔히 생각하는 통계로 그래프, 표, 또는 대표값들이 기술통계에 해당합니다. 추측통계(학) : 주로 전체 데이터(예를 들

startagainbornagain.tistory.com

저번내용이구요

 

오늘은 통계에서 확률변수와 확률분포에 대해서 공부해볼까합니다.

 

https://kr.piliapp.com/random/dice/

 

주사위 던지기 🎲

 

kr.piliapp.com

 

우리가 육면 주사위를 2번 굴린다고 할 때 모든 결과들이 나올 수 있는 집합을 우리는 표본공간이라고 합니다

더보기

{(1,1), (1,2), (1,3), (1,4) ...........(6,6)} = 표본공간

또한 나올 수 있는 모든 수를 확률변수라고 부릅니다.(ex: (1,1) = 1 (1,2) = 2)

 

만약 (1,1)나올 확률이 총 2개라고 하면 이를 확률변수를 대응시켜주는 관계인 확률 분포라고합니다

 

확률 분포를 수학적 함수관계로 나타낸 것을 확률분포함수라고 부르고 만약 확률이 연속적이지 않고 이산적 하나하나 숫자인 형태로 샐 수 있으면 이산확률변수라고 부르고 이산확률변수가 가질 수 있는 확률을 확률질량함수라고 부릅니다.

대표적으로 앞서 말한 주사위가 대표적인 이산확률변수입니다. 마찬가지로 주사위가 가질 수 있는 확률분포함수가 확률질량함수가 되는거라고 생각하시면 됩니다.

 

확률이 만약 이산적이지 않고 연속적이라고 하면 연속확률변수라고 부릅니다. 연속확률변수가 가질 수 있는 확률을 확률밀도함수라고 부릅니다.

 

오늘은 기대값까지만 설명하고 마무리 짓도록 하겠습니다.

기대값은 확률변수에 대해 확률을 가중치로 하여 계산된 값입니다.

 

더보기

동전을 2번 던져서  앞면이 0번 나오면 4000원을 상대방에게 주고, 앞면이 1번 나오면 800원을 받고, 앞면이 2번 나오면 1600원을 받는 도박을 한다면 할 것인가?

라는 문제가 주어졌다고 봅시다 단순하게 이러한 정보만 머리속에 인지하고 있는 상태에서 이상함을 느끼지 않고 좋은 조건에 도박이라고 생각하신다면 여러분들은 통계적으로 생각하시지 않으신겁니다.

 

여기서 기대이득(기대값)을 계산해볼까요?

더보기

앞면이 0번 나올 확률은 1/4 앞면이 1번 나올 확률 1/2 앞면이 2번 나올 확률 1/4

 

0번 나오면 얻는 이득(-4000) * 0번 나올 확률(1/4) + 1번 나오면 얻는 이득(800) * 1번 나올 확률(1/2) + 2번 나오면 얻는 이득(1600) * 2번 나올 확률(1/4) = -4000 * 1/4 + 800 * 1/2 + 1600 * 1/4 = -1000 + 400 + 400 = -200 = 기대이득 

네 기대이득을 계산해보니 -200원인 것을 알 수 있습니다. 200원은 저희 교수님이 농담삼아 말하시길 하우스 운영비라고 하셨던 기억이 나네요 ㅋㅋ

 

기대값은 확률변수의 위치를 나타내는 모수로서 평균(mean)이라고 부르기도 합니다. 기대값이 평균을 의미한다라는 사실을 이용하여 분산을 계산할 수 있습니다.

 

더보기

 [-4000 -(-200)]^2 * 1/4 + [800 - (-200)]^2 * 1/2 + [1600- (-200)]^2 * 1/4 

이런 식으로 가능합니다.

 

대표적으로 이산확률만 예로 들었지만  연속확률변수도 기대값과 분산 계산이 가능합니다 대신 미분을 이용해야하는 걸로 알고 있습니다. 

 

더보기

연속확률의 기대값 = 확률변수 x * 확률변수의 따른 값 *dx

연속확률의 분산 = (확률변수의 따른 값 - 기대값)^2 * 확률변수 *dx

기대값의 성질은 다음과 같습니다.

  • 상수 a의 기대값은 a입니다
  • 확률변수 x를 상수 a로 곱하거나 기대값을 a로 곱해도 기대값은 동일합니다
  • 각 다른 기대값 x, y에 각각 a, b라는 상수를 곱한해서 더한 기대값은 x와 y에 기대값에 각각 a, b를 곱한 숫자와 같습니다.
  • 기대값 x, y가 서로 확률적으로 독립일 때 x * y 기대값과 기대값 x * 기대값 y는 값이 같습니다.

분산의 성질은 다음과 같습니다.

  • 상수 a의 분산은 0입니다
  • 확률분포 x의 분산은 0보다 크거나 같습니다.

왜도 첨도에 따라 확률분포를 더 쉽게 볼 수 있습니다.

 

왜도는 비대칭의 정도입니다

왜도가 음수일 때 왼쪽으로 치우쳐진 분포함수입니다.

왜도가 양수 일 때 오른쪽으로 치우쳐진 분포함수입니다.

왜도가 0일 때 대칭인 함수입니다

 

첨도는 뾰족한 정도입니다.

첨도가 0보다 크면 평평한 분포함수입니다.

첨도가 0이라면 적절한 뾰족한 분포함수입니다.

첨도가 0보다 작으면 경사가 가파른 분포함수입니다.

 

 

반응형
LIST

'수학 > 확률과 통계' 카테고리의 다른 글

통계 이산확률분포란  (0) 2023.11.08
통계의 종류  (0) 2022.12.23
대표값  (2) 2022.09.21
확률과 통계1: 평균, 편차, 분산, 표준편차  (0) 2021.11.17