Post on 21-Dec-2015
Chap 2. Chap 2. 우연과 확률우연과 확률
2.1 우연과 확률
2.2 확률의 정의
2.3 조건부 확률과 독립사건
2.4 확률변수와 확률분포
2.5 기대값과 그 성질
SNU IDS Lab. 2006 2Chap 2. 우연과 확률
2.1 우연과 확률
Random Event ( 우연 사건 )
일어나기 전에 어떤 결과가 나올지 미리 알 수 없는 사건
Ex. 주사위 결과 , 내일의 날씨 , 태아의 성별 등
우연 사건의 결과를 결정하는 요인을 알지 못하거나 제어하지 못하기 때문에 발생
확률 계산의 원리 우연 사건의 개별적 결과는 불확실하지만 , 장기적인 결과는 거의 확실
⇒ “ 확률” : 우연적 현상의 정량적 표현
SNU IDS Lab. 2006 3Chap 2. 우연과 확률
2.1 우연과 확률
표본공간 (sample space) S
통계적 조사에서 얻을 수 있는 모든 가능한 결과들의 집합
Example
– 주사위 눈금의 수 S={1,2,3,4,5,6}
– 공정에서 10 개 불량품 제조될 때까지 제도된 제품 수 S={10,11,...}
– 전구의 수명시간 S={ }
수학적 확률 ( 고전적 정리 - Laplace(1749-1827))
N 개의 원소로 구성된 표본공간 S 에서 각각의 근원사상이 일어날 가능성이 같다는 가정 하에 m 개의 원소로 구성된 사건 A 의 확률을 다음과 같이 정의함 .
문제점 ) 유한표본공간에서만 정의됨– 각 결과가 나타날 가능성이 동일해야 함 .
SNU IDS Lab. 2006 4Chap 2. 우연과 확률
2.1 우연과 확률
출생아의 성별문제 (vs. 동전 던지기 ) 남자가 될 가능성과 여자가 될 가능성이 동등한가 ?
통계적 확률 ( 경험적 확률 ) 어떤 시행을 총 N 번 관측하여 특정결과 A 가 모두 몇 번 나타났는가 ?
세어본 결과 n 번 이었다면 , A 의 확률은 n/N 이다 핵심 조건
– 이때 , N 이 충분히 커야 한다 .
– 이제까지의 시행과 앞으로의 시행이 동일해야 한다 .
우리나라 통계청 집계 결과 1:
2002 년도에 우리나라 신생아 : 494,625 명
첫째 아이 : 239,184 명 ( 남아비율 : 51.6%)
둘째 아이 : 202,594 명 ( 남아비율 : 51.8%)
셋째 이상 : 48,876 명 ( 남아비율 : 58.5%)
SNU IDS Lab. 2006 5Chap 2. 우연과 확률
2.2 확률의 정의
확률의 공리적 정리 표본공간 S 에서 임의의 사건 A 에 대하여
–
–
– 서로 배반인 에 대하여
을 만족할 때 P(A) 를 사건 A 의 확률이라 함 .
Definition. 분할 이고 을 만족하는 을
표본공간 의 분할이라고 한다 .
SNU IDS Lab. 2006 6Chap 2. 우연과 확률
Theorem. 확률의 성질
이면
Example
3 개의 주머니에 각각 1~5 까지 번호가 매겨진 5 개의 구슬이 있다 . 각 주머니에서 1 개씩 구슬을 꺼낼 때 , 꺼낸 구슬의 숫자의 합이 5 이상일 확률은 ?
• 꺼낸 숫자의 합이 5 이상일 사건 :
• 꺼낸 숫자의 합이 5 미만 (4 이하 ) 일 사건 :
• 꺼낸 숫자의 합이 4 일 사건 :
• 꺼낸 숫자의 합이 3 일 사건 :
•
2.2 확률의 정의
SNU IDS Lab. 2006 7Chap 2. 우연과 확률
2.3 조건부 확률과 독립사건
Definition. 조건부 확률 사건 A 가 주어졌을 때 , 사건 B 가 일어날 조건부 확률
Example
두 개의 주사위를 던지는 실험에서 첫 번째 던진 주사위 눈이 두 번째 던진 주사위의 눈보다 클 때 두 주사위 눈의 합이 10 일 확률은 ?
• 첫 번째 주사위의 눈이 두 번째 주사위의 눈보다 더 큰 사건 : A
• 합이 10 인 사건 : B
• P (A) = 15/36 , P (B) = 3/36 , P (A∩B) = 1/36
• P (B|A) = 1/15
SNU IDS Lab. 2006 8Chap 2. 우연과 확률
2.3 조건부 확률과 독립사건
Lemma. 조건부 확률의 곱셈법칙 P (A) > 0, P (B) > 0 이면
Example
불량품이 20 개이고 양호품이 80 개인 로트에서 2 개의 단순랜덤표본 추출 시 2 개 모두 불량품일 확률은 ?
• 첫 번째 제품이 불량품일 사건 : A
• 두 번째 제품이 불량품일 사건 : B
•
SNU IDS Lab. 2006 9Chap 2. 우연과 확률
2.3 조건부 확률과 독립사건 (Advanced)
Lemma. 전확률의 공식
사건 A1,∙∙∙∙∙, An 이 표본공간 S 의 분할일 때 , P (Ai) > 0 에 대하여 다음이 성립
Example
통계학과 학생 중 한 학생을 단순랜덤 추출하였을 때 , 그 학생이 수학 과목 수강생일 확률은 ?
– 통계학과 학생 : 1 학년 30%, 2 학년 25%, 3 학년 25%, 4 학년 20%
– 수학 수강생 : 1 학년의 50%, 2 학년의 30%, 3 학년 10%, 4 학년 2%
1
학년
2
학년
3
학년
4
학년
통계학과 학생
수학 수강생
SNU IDS Lab. 2006 10Chap 2. 우연과 확률
2.3 조건부 확률과 독립사건
Definition. 독립사건 (Pairwise Independent event)
( 또는 P (A|B) = P (A), P (B) > 0 이나 P (B|A) = P (B), P (A) > 0)
이 성립하면 사건 A, B 가 서로 독립이다 .
참고 ) A 와 B 가 서로 독립이면 ,
– A c 와 B 도 서로 독립이다 .
– A 와 B c 도 서로 독립이다 .
– A c 와 B c 도 서로 독립이다 .
음…Slide 8
서로 독립인 사건인가 ?
SNU IDS Lab. 2006 11Chap 2. 우연과 확률
2.4 확률변수와 확률분포
Definition. 확률변수 (Random Variable)
표본공간 S 에서 정의된 실수 값 함수
Example ►►
– 경제정책에 대한 찬반 여론조사에서 표본의 크기가 3 명일 때 표본공간과 확률변수
– 두 개의 동전을 던지는 실험에서 앞면의 개수에 대한 표본공간과 확률변수
Definition. 확률밀도함수 (Probability Distribution Function : pdf)
확률변수가 취하는 값이 흩어진 정도를 합이 1 인 함수로 표현한 함수– 이산형 확률변수의 확률밀도함수
– 연속형 확률변수의 확률밀도함수 를 만족하는
SNU IDS Lab. 2006 12Chap 2. 우연과 확률
2.4 확률변수와 확률분포
Examples. 확률변수 (Random Variable)
주사위를 던져서 나오는 눈금의 수
유권자가 지지하는 후보
치료 중인 환자의 완치 여부
복원을 샀을 때의 당첨 금액
하루 동안 어느 주유소를 이용한 자동차의 수
전자 부품의 수명
신생아의 몸무게
⇒ 통계학의 관심 대상이 되는 불확실성을 지닌 현상들은 모두 확률 변수로 표현
SNU IDS Lab. 2006 13Chap 2. 우연과 확률
2.4 확률변수와 확률분포
Lemma. 확률밀도함수의 성질 이산형 확률밀도함수의 성질
–
–
–
연속형 확률밀도함수
–
–
–
– 임의의 에 대하여
–
SNU IDS Lab. 2006 14Chap 2. 우연과 확률
2.5 기대값과 그 성질
를 확률변수 의 확률밀도함수라고 할 때 ,
Definition. 확률변수 기대값 (Expected Value) 또는 평균 (Mean)
확률변수의 의 기대값
일반적으로 연속형 함수 에 대하여 확률변수 의 기대값
SNU IDS Lab. 2006 15Chap 2. 우연과 확률
2.5 기대값과 그 성질
Example
1000 원짜리 복권을 사는 경우를 생각해보자 .복권의 당첨액이 1 억원이고 당첨확률이 20 만분의 1, 즉 0.000005 라고 할 때 기대값은 얼마인가 ?
– 확률변수 X 는 무엇인가 ?
X=0 (Fail), X=1 억 (Success)
– 각각의 확률은 ?
P(X=0)=0.999995, P(X=1) = 0.000005
– 복권의 당첨 기대값은 ?
E(X) = 0* 0.999995 + 1 억 * 0.000005 = 500
SNU IDS Lab. 2006 16Chap 2. 우연과 확률
2.5 기대값과 그 성질 (Advanced)
Theorem. 기대값의 성질
이면
Definition. 분산 (Variance) & 표준편차 (Standard Deviation)
Theorem. 분산의 성질
SNU IDS Lab. 2006 17Chap 2. 우연과 확률
EX1. 로또의 확률
Lotto 6/45 당첨 확률과 기대값 45 개 숫자 중에서 6 개를 골라서 모두 맞추면 1 등 당첨되는 복권
1 등 당첨 확률
총 당첨자는 782,542 명 , 7 명이 총 당첨금의 46.51% 가져감
SNU IDS Lab. 2006 18Chap 2. 우연과 확률
EX1. 로또의 확률
복권의 이면– 1 등 당첨 확률 ≈ 1/800 만
– 1 등 당첨금 ≈ 20 억
– 복권 구입액 2000 원 : 1 단위 가치
연소득 2000 만원인 직장인 A 씨의 경우 ,
– 복권 당첨액 20 억 : 1000 만 단위 가치 (100 년 소득에 해당 )
– 당첨액 기대값 = 1000 만 단위 가치 * (1/800 만 ) > 1 단위 가치 ⇒ 복권 구입 합리적
200 억대 재산가 B 씨의 경우 ,
– 복권 당첨액 20 억 : 100 만 단위 가치 ( 단순 비례 값 )
– 당첨액 기대값 = 100 만 단위 가치 * (1/800 만 ) < 1 단위 가치 ⇒ 복권 구입 비합리적⇒ 고소득층은 복권에 관심 없음
⇒ 정부는 국가공익사업 기금을 저소득층 부담으로 조성
SNU IDS Lab. 2006 19Chap 2. 우연과 확률
EX2. 첫 번째 남자아이를 가질 때까지
평균 몇 명의 아이를 낳게 될까 ?
어느 부족 사회는 남자아이를 갖고자 하는 사회적 정통이 강하여첫 번째 남자아이를 가질 때까지 계속 출산한다고 한다 . 출산이 계속 가능하고 , 일단 남아를 1 명 낳으면 출산을 정지한다 .출생 성비가 어떤 영향을 받을까 ?
남아를 낳을 확률 p, 여아를 낳을 확률 q (1-p)
부부가 낳게 될 총 아이의 수 : X
P[X=1] = p
P[X=2] = qp
P[X=3] = q2p …
P[X=k] = qk-1p , k= 1,2,3,….
E[X] = ?
SNU IDS Lab. 2006 20Chap 2. 우연과 확률
EX3. 쉬발리에 드 메레씨의 의문
17 세기 유행하던 2 개의 Game, 각각 승리할 확률은 ?
1) 동일한 주사위 4 번 던져서 그 중 1 번이라도 1 의 눈이 나오는 경우 승리
2) 24 차례에 걸쳐 주사위 2 개를 던지는데 , 한번이라도 동시에 1 이 나오면 승리
SNU IDS Lab. 2006 21Chap 2. 우연과 확률
EX3. 쉬발리에 드 메레씨의 의문
Game 옵션 1
동일한 주사위 4 번 던져서 그 중 1 번이라도 1 의 눈이 나오는 경우 승리 .승리할 확률은 ?
다음의 경우 승리– 4 번 모두 1 이 나오는 경우
– 3 번 1 이 나오고 , 1 번 1 이 아닌 숫자가 나오는 경우
– 2 번 1 이 나오고 , 2 번 1 이 아닌 숫자가 나오는 경우
– 1 번 1 이 나오고 , 3 번 1 이 아닌 숫자가 나오는 경우
또는…
– 1 – P[4 번 모두 1 이 아닌 숫자가 나오는 경우 ] = 1 – (5/6)4 = 0.518
SNU IDS Lab. 2006 22Chap 2. 우연과 확률
EX3. 쉬발리에 드 메레씨의 의문
Game 옵션 2
24 차례에 걸쳐 주사위 2 개를 던지는데 , 한번이라도 동시에 1 이 나오면 승리 .승리할 확률은 ?
1 번 시행에서의 표본공간– S= {(1,1), (1,2), (1,3), ……… , (6,6)}
1 번 시행에서의 승리할 확률– P[ 모두 1 이 나오는 경우 ] = 1/36
24 번 시행에서 승리할 확률– 1 – P[24 번 모두 1 이 아닌 숫자가 나오는 경우 ] = 1 – (35/36)24 = 0.491
SNU IDS Lab. 2006 23Chap 2. 우연과 확률
EX4. 도박꾼의 파산 : 모의 시행
Roulette Odd/Even Game
Player 가 이길 확률 : p=18/38
Roulette 50판까지 버틸 확률은 ?
Player 의 판돈은 5 만원
한 판에 1 만원씩 건다 .
쉽지 않은 확률…
– 실제 카지노에 가서 해본다
– 수백 번의 시행이 필요
– 모의시행
20 번 시행 했을 때
– 50판까지 돈이 남아있는 경우 , 8/20 ≈ 0.4
– 대부분 50판이 아닌 끝까지 간다⇒ 승률 p≤0.5 인 경우 , 도박꾼이 이길 확률은 0
SNU IDS Lab. 2006 24Chap 2. 우연과 확률
EX5. 우연의 확률
Lotto 6/45
1 등에 당첨될 확률 : 1/814 만
모두 1 등을 놓칠 확률– (1- 1/8,140,000)8,140,000
≈ 0.3679
축구장 내 23 인의 생일이 모두 다를 확률 1st 사람의 생일은 어느 날이어도 된다 .
겹치지 않을 확률 = 365/365
2nd 사람은 1st 사람과 겹치면 안 된다 . 겹치지 않을 확률 = 1*364/365
3rd 사람은 1st, 2nd 사람과 겹치면 안 된다 .겹치지 않을 확률 = 1*364/365*363/365
……
SNU IDS Lab. 2006 25Chap 2. 우연과 확률
EX6. Inverse Probability
의사 A 가 내원 고객 B 를 촉진 검사한 결과 유방에서 알갱이 발견 환자 중 주로 1% 만이 악성이므로 A 는 양성이라 확신한다 .
그래도 혹시…하여 유방 X 선 사진을 찍어보니 악성결과가 나왔다 .
– X 선 사진기는 악성 종양에 대해 80% 정확 , 양성 종양에 대해 90% 정확
B 가 정말로 악성일 확률은 얼마인가 ?
– 100 명의 의사들이 75% 라고 대답
– But… 정답은 7.5%