확률에 대해서 오해하시는 분들이 계신 듯 합니다.
팁을 몇 자 적어볼까 합니다.
1. 최종 성공확률 계산 방법
한 번 시행했을 때 성공 확률이 20%인 경우는,확률의가능성의중복시행을어떻게이해할것인가클리앙 한 번 시행했을 때 실패 확률이 80%라는 의미입니다.
두 번 시행했을 때 한 번 이상 성공할 확률은 전체 확률에서 모두 실패했을 때의 확률을 뺀 값입니다.
즉 1 - 0.8 * 0.8 = 0.36, 즉 36%입니다.
n번 시행했을 때 한 번 이상 성공할 확률도 마찬가지로 1 - 0.8 ^ n 공식으로 계산할 수 있습니다. n = 5일 때 성공 확률은 다음과 같습니다.
1 - 0.8 * 0.8 * 0.8 * 0.8 * 0.8 = 0.67232, 즉 67.232%입니다. 당연히 100%는 아니지만, 생각보다 높습니다.
2. 최종 성공확률 계산의 함정 - 독립시행인가 아닌가?
그런데, 저기에는 몇 가지 함정이 숨어 있습니다.
먼저, 첫 번째 시도와 두 번째 사이에는 아무런 상관관계가 없어야 합니다. 이를 '독립시행'이라고 합니다.
하지만, 다섯 개의 테스트를 동시에 독자적으로 시행하지 않는 이상 현실 세계에서는 이런 경우가 잘 일어나지 않습니다.
첫 번째 경우, 1차 시도에서 실패했는데, 이를 통해서 매우 좋은 교훈을 얻은 경우입니다. 이 경우는 20%였던 성공 확률 값이 2차 시도에는 바뀐다는 의미입니다. 이 값은 올라갈 수도, 내려갈 수도 있습니다. 기술이 좋아져서 더 좋은 위치를 선택하면 올라갈 것이고, 반대로 첫 번째 시도의 교훈으로 안될 일이라는 판단 기준이 많아지면 내려갑니다.
두 번째 경우, 1차 시도로 인해서 모수가 바뀌는 경우입니다. 예를 들어 테스트 경우가 5개로 미리 정해져 있고, 그 중 반드시 하나는 정답인 경우에 정답 확률 20%인 그런 상황입니다. 이 때 만약 처음 실패한 경우 두 번째 시도는 4곳 중에 한 곳이 성공인 경우가 되므로 두 번째 테스트의 성공 확률은 25%입니다. 만약 "5번 해서 한 번은 반드시 나온다"는 말이 맞다면, 이런 경우에만 해당됩니다.
이 경우 한 번 시도 했을 대의 성공 확률은 20%, 두 번 시도 했을 때의 성공 확률은 40%, 세 번은 60%, 네 번은 80%, 다섯 번은 100%입니다.
하지만, 5개가 미리 정해져 있고 그 중 하나가 반드시 나온다면 그걸 20% 성공확률이라고 표현할 멍청이는 세상 어디에도 없을겁니다. 당연히 100% 성공한다고 이야기했겠죠.
만약 1회 시행에 성공 확률이 20%이고 5번 시행이 정해져 있는 상황인 경우 독립 시행이라면 성공 확률 67.232%라고 이야기 했을겁니다.
3. 또 다른 오해와 함정들
일단 독립 시행이라고 가정합시다. 1번 시도 했을 때의 성공 확률은 20%이고, 2번 시도 했을 때의 성공확률은 36%입니다.
이 상황에서 1번 시도 해서 실패했습니다. 그러면 두 번째 시도에서의 성공 확률은 36%일까요?
독립 시행이라는 말을 위에서 예를 들어서 설명드렸으니, 두 번째 시도에서의 성공 확률이 20%라는 점은 따로 설명하지 않아도 될 것 같습니다.
그리고 가장 큰 함정은 이것입니다. 20%의 정체입니다. 이 정체를 모르니 67.232%라는 생각보다 높은 성공률에도 아무런 기대가 되지 않는 것입니다.
4. 가장 큰 문제 둘
확률로 접근하고 통계로 분석하는 것은 매우 중요한 방법론입니다. 사회과학이건 자연과학이건 오늘날 연구의 핵심 기본 도구 중 하나입니다.
첫 번째 큰 문제는, 우리가 어떤 사건을 확률로 모델링할 때 '응 20%야'라고 이야기하는 것은 큰 문제가 있습니다. 왜 20%인지를 과학적 방법론으로 설명할 수 있어야 하며, 이 숫자의 신뢰 수준도 함께 이야기를 해야 합니다. 조금 과하게 이야기해서 신뢰 수준 없이 확률을 이야기하거나, 설사 불필요하다고 판단해서 신뢰 수준을 이야기 하지 않았다 해도 누군가 이런 의문을 가졌을 때 근거와 신뢰 수준에 대한 이야기를 할 수 없는 확률을 논하는 자는 반드시 둘 중 하나입니다.
과학적인 접근 방법으로 이야기 할 필요가 없는 자리에서의 이야기꾼이거나, 사깃꾼입니다.
(대통령이 사깃꾼이라는 소리는 아닙니다. 이번 발표에서 대통령의 문제점은 두 번째 큰 문제에 해당됩니다. 대통령에게 저 숫자를 가져다준 사람이 20%의 근거와 신뢰 수준을 이야기 할 수 없다면 그 사람이 사깃꾼이라는 이야기입니다.)
두 번째 큰 문제는, 이런 근거를 바탕으로 의사 결정을 시행하고 이를 발표하는 자리에서 확률을 이야기하는 것 자체가 문제입니다. 과학적 언어와 대중의 언어는 괴리되어 있고, 그 간격에 숨어 있는 과학적 방법론을 모두 설명할 수 없기에 확률과 관련된 문제를 대중에게 설명하기 위한 공인된 표현법들이 있습니다. 예를 들어 기대값입니다. 예를 들어 이런 식입니다.
"5000억원을 투자해서 성공하면 1조원을 버는데 실패하면 3000억원을 날린다. 성공확률은 20%이다. 20%의 확률로 5000억원의 수익이 생기고 80%의 확률로 3000억원의 손실이 생기기 때문에 기대 수익은 -1400억원이다."
이 말에 따라서 붙을 수 있는 정책적 표현이 있습니다. "비록 기대 수익은 -1400억원이지만, 이 과정의 고용창출효과, 노하우 축적 블라블라 ... 그래서 과감히 투자하기로 결정했다. 성공했을 때의 1조원의 이익도 한 번 도전해 볼만한 규모라고 정책적으로 판단했다" 라는 식의 표현이죠.
이런 직관적이고, 정치적으로 책임 소지가 어디 있는지를 확인 할 수 있는 표현 대신 최고 의사 결정권자가 확률을 가지고 이야기를 하는 것은 대중을 호도하겠다는 것으로 받아들여집니다. 조금 과하게 말해서 이런 겁니다. 여러분. 로또 확률이 845만분의 1이니까, 로또 845만장 사면 로또 1등 당첨됩니다!
5. 사족
아닌 것 같지만 이 글은 팁입니다. 확률을 어떻게 대해야 하느냐, 그리고 그 결과를 외부에 어떻게 전달해야 하느냐에 관한 팁입니다. 뭔가 이상한 생각이 드셨다면, 그건 오해입니다. 저희집 고양이가 뭔가 했나봅니다.