확률과 평균값

2024 파리올림픽 양궁 경기를 중계방송하는 MBC는 화면 왼쪽 아래에 선수의 ‘10점 확률’과 ‘심박수’를 보여줌으로써 시청자들에게 대한민국 선수들의 승리 가능성을 예측하는 데 도움을 주고 있다.

양궁에서 최고 높은 점수는 10점이므로 매 세트마다 10점씩 3발을 쏘면 이길 확률은 90%가 넘어간다. 왜 100%가 아니고 90%냐고 양궁에 대해서 일도 모르는 인간은 우길 수 있으나 상대방도 ‘몬딱’(전부 또는 모두의 제주어) 10점을 쏠 수 있기 때문이다. 이럴 경우 5세트를 마치고 ‘숏오프’까지 갈 수 있기 때문에 그때는 10점이 아니고 정중앙을 쏘아야 하니까 그건 모르는 일이지?라고 해야 하지 않겠는가. 그래서 5세트까지 15발을 10점 쏘아도 이길 확률은 100%가 아닌 것이다.

하여튼 MBC는 국민에게 사랑받는 방송답게 ‘확률’이니 ‘심박수’이니 하는 과학적 용어를 동원하여 중계방송을 하는 것을 보니 올림픽을 단순 스포츠 행사가 아니고, 과학예산을 전부 깎아버린 지금의 정부를 대신하여 국민들에게 과학 공부의 장으로 만드는 것 같아 과학선생님인 우리 큰 아이를 대신하여 MBC에 고맙다는 말을 전한다.

여러분들도 중계방송을 봐서 알겠지만 남자 양궁 개인전 결승에서 MBC는 화면 아래에 매 세트마다 김우진의 10점 확률을 보여줬다.

김우진의 10점 확률은 초반에 62.3%로 시작하여 ‘숏오프’ 때는 62.9%까지 올라갔다. 실제로 김우진은 5세트에서 3발 모두 10점을 쏘았고 ‘숏오프’에서도 10점을 쏘아 MBC가 제공한 확률이 과학적 진리임을 국민들에게 증명해주었다. 62%는 10발 중 6발은 10점 쏜다고 ‘거의 확신’하는 것이기 때문에 김우진은 그 순간 ‘10점 확률 100’으로 회귀함 셈이다.

그렇다면 MBC는 김우진의 10점 확률을 어떻게 산출했을까? 굳이 어려운 통계적 기술을 동원하지 않더라도 우리가 아는 상식적인 용어만 알아도 이해할 수 있을 것이다.

아마 내가 추정하기로는 MBC는 우선 김우진의 16강부터 4강때까지 득점분포를 수집하여 평균값을 냈을 것이다. 여기에 평균값으로부터 떨어진 값, 즉 분산값을 산출하여 그 정도를 분석하였을 것이다. 김우진의 득점은 7점이하를 쏜 적 없이 ‘매우 안정적’으로 9와 10점 주변에서 머물렀고, 이 데이터를 중심으로 결승전 시간때 날씨와, 맥박수, 관중 응원의 정도 등 심리적 요인를 변수로 넣어 결승전 초반 10점 확률을 62.3%로 산출하지 않았나 생각한다.

물론 기본적으로 확률이란 어떤 사건이 일어날 가능성에 대한 관심지표이므로 기존의 데이터가 중요한 지표가 될 수 있다. 김우진의 10점 확률은 16강부터 4강때까지 쏜 10점 횟수에 전체 격발수를 나누면 확률이 된다. 김우진 경기 데이터를 확인할 수 없어 추정해보면 5세트의 경기를 3번 했으니까 총 격발수는 15×3=45회일 것이고 이 중 10점을 쏜 경우는 세트당 평균 1.8였을 것으로 짐작된다. 그러면 10점을 쏜 횟수는 15×1.8=27회였을 것이고 따라서 결승전에서의 10점 확률은 기본 60%가 된다.

반면 아주 기본적인 확률 계산법도도 있다. 과녁이 10개이니까 10개 중 하나인 10점짜리 과녁에 맞출 확률은 1/10, 즉 10%라는 것이다. 표적의 넓이에 따라 달라지는 확률 계산법은 그래도 수학적이다. 10점 과녁의 넓이가 37.2πcm이고 전체 표적의 넓이는 3,721πcm이니까 확률은 0.01, 즉 1%다. 물론 이 수치는 원숭이가 컴퓨터 자판을 두드려 ‘김우진’이라는 이름 석 자를 치는 것보다 높지만 경험, 기술, 개인의 인지능력 등을 전혀 고려하지 않는 것이기 때문에 인간 세상의 보편적 운행 법칙인 ‘평균으로의 회귀’(아무리 못해도 10점 확률은 여자인 경우 평균 50%, 남자는 55%가 넘을 것이다)에 위반된다.

확률에서 평균값은 매우 중요한 지표다. 최고와 최저를 수없이 왔다갔다하며 그런 반복된 경험이 누적되고 결국에는 자신의 평균값이 자연스레 나올 것이기 때문이다. 김우진은 올림픽 전 각종 세계대회와 연습 때부터 당연히 자신의 평균값을 알고 있을 것이다. 평균값을 기준으로 그의 10점 확률과 세트당 기대득점이 예상되고 그러면 우리는 MBC가 제공하는 확률 데이터, 맥박수 등을 근거로 그의 금메달을 조심스레 점칠 수 있었던 것이다. 누가 그의 금메달을 의심했는가?

김우진의 금메달은 예측 불가능성을 줄이기 위해 ‘큰 수의 법칙’을 믿으며 4년 동안의 땀과 눈물로 수없이 반복된 훈련을 통해 얻은 ‘자신의 평균값으로 회귀’한 것을 설명해 줄 뿐 김우진이 무슨 특별한 재능이 있어서 그런 것이 아니다. 김우진은 최저값과 최고값을 믿지 않는다.

여기서 우리는 리처드 도킨스를 떠올릴 수 있다. 도킨스는 진화를 ‘개체의 우연한 돌연변이’가 아니라, ‘확률의 누적’에 의한 방향 없는 축적의 결과로 보았다.1) 

진화에는 장기적 목표 따위는 없다. 중요한 것은 ‘현재의 이득’이다. 현재의 이득이 미래에 누적적 선택의 결과로 나타날 뿐이다.

김우진은 매일 활을 쏘며 ‘현재의 이득’, 즉 한 발 한 발의 오차를 줄이기 위한 훈련을 반복했다. 그가 올림픽 무대에서 쏘아낸 완벽한 10점은 결코 ‘운’의 산물이 아니다. 그것은 “진화가 무작위적인 듯 보이지만 결코 무작위적이지 않다”는 도킨스의 설명처럼, 작은 이득의 누적이 평균값을 높였다. 김우진의 금메달은 ‘운이 좋은 순간’에 얻어진 기적이 아니라, 수없이 반복된 통계적 행위가 만든 평균의 귀결이다. 다시 말해, 진화가 무수한 시행착오 속에서 특정 형질로 수렴하듯, 김우진은 반복을 통해 ‘자신의 평균값’에 도달한 것이다. 그의 금메달은 통계와 과학이 만들어낸 진화적 결과라고 말할 수 있다.

표준정규분포곡선을 아는가? 종모양으로 생긴 오른쪽 곡선을 말한다. 세상 대부분의 자연현상과 우연의 사건들은 이 곡선 하나로 설명할 수 있다. 이 곡선에서 좌우 극저와 극단은 가장 적고 중앙 평균이 가장 높다는 사실을 명심하라. 그래서 평균값이 모여있는 곳의 평범한 인간들이 세상을 움직이는 것이다. 김우진은 평균값이 매우 높은 평범한 선수???? (끝)


📌 주(註)

1) 리처드 도킨스는 "진화는 단번에 일어나는 일이 아니다. 그것은 누적된 선택, 곧 수많은 작은 단계들이 모여 이루어진 결과다.”라고 말한다. 생물이 우연히 생겨나기에는 너무 훌륭하게 설계되었기 때문이다. 도킨스는 ‘누적적 선택(cumulative selection)’ 개념을 『이기적 유전자』와 『눈먼 시계공』 에서 다루고 있다. 

*2024년 파리 올림픽 양궁에서 금메달을 획득한 경기 직후 네이버 밴드에 올린 글을 다시 이곳으로 옮겨 적음.*

댓글 쓰기

0 댓글