살짝 바꾼 약간의 차이, 큰 결과 (통계라는 이름의 거짓말, Damned lies and statistics)


"Every year since 1950, the number of American children gunned down has doubled."
“1950년이래 총기로 희생되는 미국 어린이의 숫자가 매년 두 배로 증가했다.”


"The number of American children killed each year by guns has doubled since 1950."
"매년 총기로 사망하는 미국 어린이의 숫자는 1950년 이래 두 배가 되었다.”

 

위의 두 문장은 같은 문장일까?

금방 눈치를 챘다면 당신은 수학 문맹은 아니다. 위의 두 문장은 순서를 살짝 바꾸고 단어를 몇 개 교체한 것이다. 그냥 보기에는 별다른 차이가 있는 것 같지 않다. 하지만, 수식을 사용하거나 그래프를 그려 보면 엄청난 차이가 있음을 금방 알 수 있다.

첫번째 문장은 수가 매년 2배씩 증가했다는 뜻이다. 즉, 다음과 같이 된다는 뜻이다.

(1) y = (2x)a


두번째 문장은 수가 1950년 에 비해 2배가 되었다는 뜻이다. 즉, 다음과 같이 된다는 뜻이다.

(2) y = 2a


그럼 구체적으로 들어가보자. 1950 년에 총기사고로 사망한 어린이 숫자를 1명이라고 하면(즉, a = 1 일 때) (1) 과 같이 계산했을 때,

1950년 1명
1951년 2명
1952년 4명
1953년 8명
1954년 16명
1955년 32명
1956년 64명
1957년 128명
1958년 256명
1959년 512명
1960년 1024명  210 = 1024

...

1970년 1048576명  220 = 1048576

...

1980년 1073741824명  230 = 1073741824 (10억명이 넘는다!)
1981년 2147483648명  (드디어 20억!)
1982년 4294967296명  (40억 -_-;)
1983년 8589934592명  (인류 멸종)

(2) 와 같이 계산 하면

1950년 1명
2008년 2명


비슷해 보이는 문장이지만 그 속에 담겨 있는 의미는 엄청나게 다르다는 것을 알 수 있다. 이런걸 신문기사에서 인용하거나 무슨무슨 운동가들이 인용한다고 생각하면 꽤나 불편할 수 밖에 없다. 문장을 살짝 교체하여 비슷한 것처럼 꾸며놓고 잘못된 결론을 유도할 수 있기 때문이다. (1) 번 식 같은 경우는 초등학교 탐구생활에도 나왔던 내용이라서 많은 사람들에게 익숙한 내용이다. 뭐, 이런 내용이지.

'옛날옛날에 어느 부잣집 하인으로 들어간 돌쇠가 주인에게 이렇게 말한다. "저는 첫날에는 쌀 한톨, 두번째 날에는 2배인 쌀 두톨, 세번째 날에는 전날의 2배인 쌀 네 톨을 받겠습니다." 이런 바보가 있나 하고 생각한 주인은 얼른 그 제안을 받아들인다. 그리고 얼마 못가서 주인은 돌쇠에게 가진 재산을 모두 주고 말았다.'

나는 언젠가 돌쇠같은 놈을 반드시 만나리라 생각하고 있기에 절대로 이 사실을 잊지 않으리라고 나름 맹세를 했다. 그런데 서점에 갔다가 우연히 본 책에서 미국에도 그런 놈이 있더라는 것을 알게 되었다. 그 책의 제목은 '통계라는 이름의 거짓말(Damned lies and statistics)' 이다. 서점에서 일부 내용만을 읽었기에 전체 내용은 알 수 없지만 통계를 위한 범위를 어떻게 잡느냐 , 어떤 의도로 설문조사를 하느냐 등에 따라 결과가 달라진다는 내용이었다. 책 내용에 수학이 별로 나오지는 않는다. 의도적으로 삭제한 것 같은데, 간단한 수식과 그래프가 있다면 더 이해하기 쉬웠을 것이다. 수식이 복잡하다면 대중에게 멀어지는 책이 되겠지만 아주 간단한 것은 그래프와 함께 보여주는 것이 더 이해하기 쉽지 않았을까. 그리고 문장을 수식으로 변환하고 그것을 그래프로 쉽게 그리는 법을 설명함으로서 문장에 속지 않도록 하는 것이 진정한 대중서적으로서의 의미가 있을 것 같다. 재미있는 책이지만 그런것까지 생각하지 못한 것은 아쉽다. 수식을 쓰지 않는다고 무조건 쉬운 책이 되는 것은 아니다. 수식을 쉽게 설명하는 책이 쉬운 책이지.
 
통계라는 이름의 거짓말 - 8점
조엘 베스트 지음, 노혜숙 옮김/무우수
 
Damned lies and statistics 의 Introduction 은 다음에서 읽을 수 있다.
http://www.ucpress.edu/books/pages/9358/9358.intro.php

 

'책탐구' 카테고리의 다른 글

사기(史記) 본기  (0) 2009.01.22
정말 좋은 전자기학 책  (12) 2009.01.14
사진으로 보는 저작권, 초상권, 상표권 기타 등등  (0) 2009.01.12
모략의 즐거움  (0) 2009.01.06
다음 중 맞는 표현은?  (0) 2008.08.13