드무아브르의 중심극한정리(iv) : 가우시안의 눈부신 등장

이제 예정보다 길어진 시리즈의 마지막편이다. 처음 글에서 제기했듯이, 이 글은 고교 교과 과정에서 다음과 같이 얼버무리고 간 내용에 대해 약간의 구멍을 메꾸기 위한 것이다.

확률변수 X가 이항분포 B(n,p)를 따를 때, n이 충분히 크면 X의 분포는 근사적으로 정규분포 N(np,npq)를 따른다는 것이 알려져 있다.

잠시 여담이지만, 이렇게 중고딩 교과서에 '~임이 알려져 있다'라고 하는 부분은 사실 교사에게도 학생에게도 크게 중요한 것은 아닐 것이다. 그러나 나의 경험으로 볼 때, 이 순간이야말로 선생님들이 어린 아이들의 가슴 속에 세상에 매우 긍정적인 야망을 심어줄 수 있는 좋은 찬스인 것이다. 바로 이런 곳에 더 높은 수준의 학문을 향한, 학생들이 밟을 수 있는 디딤돌이 놓여져 있는 사회가 건강하고 튼튼한 것이라는 믿음하에 이 글은 작성되고 있다. 또한 중심극한정리라는 것은, 이 세상에서 왜 일어나야 할 일들이 일어나고 있는지를 설명해주는 중요한 수학적, 통계학적 교양의 소재이기도 하다.

드무아브르의 중심극한정리라는 것을 다시 한번 쉬운 말로 표현하자면, 동전을 많이 던졌을 때 앞면이 나오는 횟수의 확률분포는 거의 정규분포를 따른게 된다는 것이다.

지난 글에서는

[math]
\frac{1}{2^{2n}}{2n\choose n} \approx \frac{1}{\sqrt{\pi n}}
[/math]

임을 월리스 공식을 사용하여 보인 바가 있다. 동전을 2n번 던질때, n번 나올 확률이 얼마인지 근사식을 차아본 것이다. 이제 동전을 2n번 던져서, n+k 번 나올 확률이 얼마인지를 알아보려 한다. 그리하려 계산하려 하는 것은 바로 다음 식이 되겠다.

[math]
{2n\choose n+k}{2n\choose n}^{-1}
[/math]

앞서 구한 것을 이용하고자 비율을 구할 것이다.

[math]
{2n\choose n+k}{2n\choose n}^{-1} = \frac{n! n!}{(n+k)!(n-k)!} = \frac{n(n-1)\cdots(n-k+1)}{(n+k)(n+k-1)\cdots (n+1)}= \frac{1 (1-1/n)\cdots(1-(k-1)/n)}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)}
[/math]

이제 우변의 근사값을 구하기 위해, 로그를 사용하는데, 이 과정에서 로그에 대해 알아야 할 것은 이전과 마찬가지로 두 가지. 하나는 로그는 곱셈을 덧셈으로 바꾼다. 그리고 또 하나는 x가 충분히 작을 때,

[math]\ln (1+x) \approx x [/math]

라는 것이다.

우변에 로그를 취하게 되면,

[math]\ln \frac{(1-1/n)\cdots(1-(k+1)/n}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} [/math]

[math]= \ln { (1-1/n)\cdots(1-(k+1)/n})- \ln {(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} [/math]

이 되고,

[math] \ln {(1-1/n)\cdots(1-(k+1)/n)} \approx - (\frac{1}{n}+\frac{2}{n}+\cdots +\frac{k-1}{n}) = - \frac{k(k-1)}{2n} [/math]

[math]\ln {(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} \approx (\frac{k}{n}+\frac{k-1}{n}+\cdots +\frac{1}{n} = \frac{k(k+1)}{2n} [/math]

따라서, 다시 지수함수를 취해주게 되면 다음과 같은 식이 얻어지게 된다.

[math] \frac{1 (1-1/n)\cdots(1-(k-1)/n)}{(1+k/n)(1+(k-1)/n)\cdots (1+1/n)} \approx \frac{\exp(-\frac{k(k-1)}{2n})}{\exp(\frac{k(k+1)}{2n})} = \exp(-\frac{k^2}{n})[/math]

두둥! 마침내 무언가가 나타났다. 지금까지 한 작업을 요약하자면,

[math]
{2n\choose n+k}{2n\choose n}^{-1} \approx \exp(-\frac{k^2}{n})
[/math]

[math]
{2n\choose n+k} \approx {2n\choose n}\exp(-\frac{k^2}{n})
[/math]

따라서 동전을 2n번 던져서 n+k번 나올 확률이란,

[math]\frac{1}{2^{2n}}{2n\choose n+k} \approx \frac{1}{\sqrt{\pi n}} \exp(-\frac{k^2}{n})[/math]

이 되는 것이다. 마침내 다음과 같이 생긴 녀석,

[math]b \exp \left(-ax^2 \right) [/math]

가우시안이 등장한 것이다.

여기서 이제 n+k=x 로 두고, 2n번 던져서 x 번 나올 확률을 보게 되면 그 확률은 대략,

[math] \frac{1}{\sqrt{\pi n}} \exp(-\frac{(x-n)^2}{n}) [/math]

이 된다. 그리고 B(2n,1/2)의 평균과 표준편차

[math]\mu=n, \sigma^2=\frac{n}{2}[/math]

를 이용하여, 중심극한정리가 예측했던 바를 써보면,

[math]\frac{1}{\sigma \sqrt{2\pi} } \exp \left(-\frac{(x-\mu)^2}{2\sigma ^2} \right) = \frac{1}{\sqrt{\frac{n}{2}}\sqrt{2\pi} } \exp \left(-\frac{(x-n)^2}{2 \frac{n}{2}} \right) = \frac{1}{\sqrt{\pi n}} \exp(-\frac{(x-n)^2}{n}) [/math]

우리가 얻은 식과 똑같지 않은가! 이상 드무아브르 버전의 중심극한정리를 유도해보았다.

다 쓰고 보니, 수식치기만 힘들었지 다들 떠나고 읽을 사람은 얼마 안 될 것 같다는 ... OTL ... 이상으로 이번 시리즈는 여기서 마무리 지으니 블로그 쥔장에게 격려의 박수를... -_-;

독일의 10 마르크 화폐에 새겨진 가우스와 가우시안


돈이 멋있다능...

16 Responses to “드무아브르의 중심극한정리(iv) : 가우시안의 눈부신 등장”

  1. 휴학생;; says:

    고등학교때 나오는 정규분포가 구체적으로
    "왜 이렇게 밖에 나올수 없었는지..." 몰라서 답답했었는데....

    secret code를 세세하게 설명해주셔서 정말 감사합니다 ^^

    피타고라스님의 글에서 수학적 배경지식을 구체적이고 명확하게 알게되어서 정말 기쁩니다!~

  2. 나비 says:

    짝짝짝!
    이해는 안 됐지만 격려의 박수를 보냅니다.
    눈은 이 시리즈 전편을 따라 여기까지 왔지만 머리는... -_-

  3. pythagoras says:

    휴학생/ 사실 이것도 좀 불완전하긴 합니다만, 그래도 맛배기는 될것이라 생각합니다. 어쨌든 좋은 말씀 감사합니다.

  4. pythagoras says:

    나비/ 오랜만에 오셨네요~ ^^ 역시 수식이 많으면 좀 어렵죠? ㅎㅎ 다음에는 좀 말로 할 수 있는 좋은 소재를 찾아봐야겠네요.

  5. 나비 says:

    오랫만이라니요?
    RSS에 등록해 두어서 늘 읽고 있는 걸요.^^
    수학이니 수식이 많아도 괜챦습니다만,
    고교 문과수학을 너무 많이 벗어나면 소외감을 느낍니다.^^

  6. 검은머리 says:

    전~혀 모르면서, 그냥 박수만 .. 짝짝~~~

  7. pythagoras says:

    나비/ 아 RSS를 사용하시는군요~ 소외감을 느끼지 않게 소재발굴에 힘쓰도록 하겠습니다..

  8. pythagoras says:

    검은머리/ ㅋ 감사합니다.

  9. 피글링 says:

    잘 읽었습니다~! 모르고 있던 수식 표현이나 생소한 사실들 때문에 정독하는 데 드는 시간 이상으로 위키를 들여다봐야 했지만ㅎㅎ 끝까지 따라올 수 있었어요! 호킹은 대중용 책을 쓸 때 작정하고 수식을 걸러내는 전략으로 대성공했다고 하지만...그래도 수식의 뻑뻑해 보이는 첫인상에 한번 익숙해지고 나면 재미있어지는 시점이 있나 봐요. 요즘은 세상 돌아가는 게 넘 험해서 다른 일들 다 버리고 구냥 딱 수학책만 파고 싶어요. 피타고라스 님 덕분에 잘 읽었습니다~

  10. pythagoras says:

    피글링/ 글쓴 보람이 있네요. ^^ 더 알고 싶은 소재들이 있으면, 알려주시면 좋습니다.

  11. 코난 says:

    음.. 알것 같기도 하고.... 하지만 다짜고짜 정규분포 공식이 나오는 것 보다는 훨씬 이해하는데 도움이 되는거 같아요..
    통계학을 기초부터 공부하려면 어떤 책이 좋을까요? 책좀 추천해 주세요.

  12. pythagoras says:

    코난/ (대학 때 하나 수업들은 거 말고는) 통계학 책을 본 게 없어서 알려드릴 것이 없네요 ㅋ 죄송.

  13. 이푸른빛 says:

    안녕하세요~^^ 물리학을 전공하는 대학원생입니다. 발표준비를 하다가 여기까지 왔네요. 몇개의 포스트를 보고 전율을 느꼈습니다 >_< 물리학에서 느꼈던 그런 기분을 수학에서도 느낄 수 있다는 거 처음 알았어요. 님의 글속에 물리학이야기도 꽤 나오고.. 너무 좋네요^^ 북마크 해두고 시간날 때마다 종종 들를게요~~

  14. 아이수 says:

    http://www.statisticalengineering.com/central_limit_theorem.htm

    이것도 재밌는 것 같아요.
    수식은 잘 이해하지 못해도
    그림을 보니까 왜 그런지 알 것 같아요.^^

  15. 아이수 says:

    부분적으로는 좀 더 고민해야 할 부분이 있지만
    전체 흐름을 이제 겨우 알 것 같네요.

    이거 하나에 한 달 걸리다니..@@

  16. 복학생 says:

    정말 좋은 글 감사합니다. 고등때도 왜 그래요?라고 물으면 쓸데없는 거 묻지말고 공부나 하라고 했었고 대학교 와서도 늘 스스로 찾는 겁니다라는 말만 듣고선 현실과 이상의 괴리라는 철학적주제마저 생각하게 했던 부분을 오늘에서야 알았습니다
    주인장님 만나면 밥이라도 사고 싶습니다ㅜㅜ (감동의 물결~~)
    귀한 정보랑 수학적 논의 까지도 개재해주셔서 넘 감사하고요 성적도 좋은 복학생되려고 또 공부하려 가 보렵니다^^ 주인장님 화이팅!!