본문 바로가기
  • think normal
새로워지기/문장 발효 과학

북 | 무기화된 거짓말( 대니얼 레비틴)

by 청춘만화 2023. 10. 8.

오는 10월 북스터디 책인 슈퍼씽킹 책을 보다가 저자의 참고 문헌을 통해 알게 된 무기화된 거짓말이라는 책을 접하게 되었다. 읽다가 메모했던 주요 키워드와 관련 내용들을 남겨본다. 

 

대니얼 레비틴 Daniel Levitin (출처 TED)

 

 

#상관관계 VS. 인과관계 p84

서로 관련이 없는 것들을 그래프로 그리기
이 세상에서는 워낙 많은 일이 벌어지다 보니 때때로 우연의 일치 가 일어나게 마련이다. 그렇다고 해서 어느 한쪽이 다른 쪽의 원인이라는 뜻은 아니다. 두 가지 현상이 서로 관련돼 있을 때 한쪽이 다른 쪽의 원인이든 아니든 간에 통계 전문가들은 그 관계를 상관관계라고 부 른다. 이와 관련된 유명한 속담으로 “상관관계가 인과관계를 의미하지 는 않는다"는 말이 있다. 형식 논리학에는 이런 규칙에 대한 두 가지 공식적인 어구가 있다.

무기화된 거짓말. 상관관계 예시

1) '이것 다음에, 그러므로 이것 때문에 post hac, ergo propter hoc"
한 현상(Y)이 다른 현상(X) 다음에 일어난다는 이유만으로 X가 Y 를 '유발했다'고 생각할 때 발생하는 논리적 오류다. 사람들은 보통 출근하기 전에 양치질을 한다. 하지만 양치질이 출근의 '원인'이 되 는 것은 아니다. 이 경우에는 아마 오히려 정반대일 것이다.

2) '이것과 함께, 그러므로 이것 때문에 cum hoc, ergo propter hoc
두 가지 현상이 동시에 일어난다는 이유만으로 한 현상이 다른 현 상을 유발했다고 생각할 때 발생하는 논리적 오류다. 이런 점을 사 람들에게 납득시키기 위해 하버드 법대생 타일러 비겐Tyler Vigen은 다음 과 같은, 겉보기에만 그럴싸한 동시 발생 관계(상관관계)에 대해 책 도 쓰고 웹사이트도 만들었다.

 

 

#수량화 p94

차이를 낳지 않는 차이들
통계 자료는 두 가지 조치 사이에 어느 정도 차이가 있는지를 알 아보고자 할 때도 많이 이용된다. 두 가지 비료, 두 가지 진통제, 두 가지 수업 방식, 두 집단이를테면 같은 일을 하는 남자들과 여자들의 급여 차등 지급 등등. 두 조치는 여러 가지 방식으로 서로 다를 수 있다. 두 조치 사이에 실제로 차이가 있을 수도 있고, 실제와 전혀 상관없는 교란 요인이 표본에 들어 있을 수도 있고, 측정 과정에 오 류가 있을 수도 있고, 무작위적인 변동이 있어서 발생 가능성이 희 박한 차이가 때론 방정식의 한쪽 변 혹은 반대쪽 변에 나타날 수도 있다. 조사자의 목표는 안정적이고 반복 가능한 차이를 발견하는 데 있고, 우리는 그런 차이와 실험 오차를 구별하려고 노력한다.

하지만 언론이 '중요하다'라는 단어를 사용하는 방식에 주의하 라. 통계 전문가들에게는 그 말이 '주목할 만하다'는 뜻이 아니기 때문이다. 통계학에서 '중요하다'는 말은 결과가 검정, 카이제곱 검정, 회귀 분석, 주성분 분석 같은 수백 가지 수학적인 검사를 통과 했다는 뜻이다. 통계적 유의성 검정에서는 결과를 순전한 우연으로 얼마나 쉽게 설명할 수 있는지를 수량화한다. 관찰값이 아주 많으면 대수롭지 않은 차이라도 변화와 무작위성에 대한 우리의 모형으로 설명 가능한 범위를 벗어날 수 있다. 무엇이 주목할 만하고 무엇이 주목할 만하지 않은지를 알아내려면 온갖 검사뿐 아니라 인간의 판 단력도 필요하다. 

 

 

#정밀성 VS. 정확성 p100

정밀성과 정확성 우리는 정밀한 수치를 보면 그것이 '정확' 하다고 믿는 경향이 있 는데, 정밀성과 정확성은 같은 것이 아니다. 만약 내가 “요즘은 전기 자동차를 사는 사람이 많습니다"라고 말하면, 당신은 내가 추측을 하고 있다고 생각할 것이다. 그런데 "최근 판매된 자동차의 16.39%는 전기 자동차입니다"라고 말하면, 당신은 내가 확실히 아는 사 실을 말한다고 생각할 것이다. 하지만 이런 경우에 당신은 정밀성 precision과 정확성 accuracy을 혼동하고 있는 것이다.

나는 그 수치를 지어 냈을 수도 있고, 전기 자동차 대리점 근처의 몇몇 사람만 표본으로 삼아 조사했을 수도 있다. 앞서 언급했던 『타임』지 기사 제목을 기억해보라. 화장실을 가진 사람보다 휴대폰을 가진 사람이 더 많다는 말이었다. 그 주장은 개 연성이 없진 않지만, 왜곡돼 있다. 그것은 결코 국제연합UN의 연구 에서 밝혀진 내용이 '아니기' 때문이다. UN은 화장실에 '접근' 할 수 있는 사람보다 휴대폰에 '접근' 할 수 있는 사람이 많다고 보고했 는데, 이는 다들 알다시피 의미가 다르다.

하나의 휴대폰을 수십 명 이 함께 사용할 수도 있다. 위생 시설이 부족한 것은 여전히 비참한 현실이지만, 그 기사 제목은 만약 당신이 직접 수를 세어보면 전 세 계에 화장실보다 휴대폰이 더 많다는 사실을 확인하게 되리라는 식 으로 이야기하는데, 이는 기사의 자료로 뒷받침할 수 있는 주장이 아니다. '접근(권)'은 당신이 통계 자료에서 조심해야 하는 단어 중 하나 다. 어떤 사람들이 의료 서비스에 접근할 수 있다는 말은 그냥 그들 이 의료 시설 근처에서 살고 있다는 뜻일 수도 있다. 그들이 그 시 설을 이용할 수 있다거나 그 비용을 지불할 수 있다는 뜻은 아닐 수 도 있는 것이다. 앞서 살펴보았듯이 케이블 방송인 C스팬은 1억 가구에서 이용 가능하지만 그렇다고 1억 명이 그 방송을 시청한다는 뜻은 아니다. 나는 세계 인구의 90%가 인터넷 접속 가능 장소, 철도, 도로, 활주로, 항구, 개썰매 길에서 반경 40km 안에 있다"는 사실을 입증함으로써 세계 인구의 90%가 무기화된 거짓말』에 '접근'할 수 있다고 주장할 수도 있다. 

 

 

서로 전혀 다른 두 가지를 비교하기 p101

통계 자료로 거짓말을 하는 방법 중 하나는 자료 집합, 모집단, 상 품 등 서로 다른 대상들을 비교하면서 대상이 서로 다르지 않은 것 처럼 구는 것이다. 오래된 관용어처럼, 사과와 오렌지 Applies and orange (서 로 전혀 다른 두 가지)를 비교하면 안 된다. 당신은 미심쩍은 방법을 써서 -지금 아프가니스탄에서 일어나고 있는 전쟁 같은- 무력 충돌의 기간에 군대에 있는 편이 미국의 자기 집에 서 편안하게 있는 것보다 더 안전하다고 주장할 수 있다. 먼저 2010 1년에 미군 3,482명이 전시 근무 중에 죽었다는 사실부터 보자. 군대 의 총원이 143만 1,000명이니, 1,000명당 2.4명꼴로 사망한 셈이다. 2010년에 미국 전역의 사망률은 1,000명당 8.2명꼴이었다. 바꿔 말하면, 미국에서 살고 있는 것보다 전쟁 지역에서 군대에 있는 편 이 세 배 넘게 안전하다는 것이다. 도대체 뭐가 어떻게 된 것일까? 두 표본은 비슷하지 않으므로 직접 비교하지 말아야 한다.

 

 

 

#스토리텔링 애니멀

우리는 어떻게 아는가?
우리는 스토리텔링 애니멀이자 사회적인 동물이다 보니, 다른 사 람의 의견에 쉽게 흔들린다. 우리는 3가지 방식으로 정보를 얻는다. 첫째, 직접 발견하기도 하고, 둘째, 은연중에 받아들이기도 하고, 셋 쩨, 누군가에게서 명시적으로 전달받기도 한다. 우리가 세상에 대해 아는 내용 중 상당 부분은 이 마지막 범주에 속한다. 즉 살아오는 도 중에 어떤 정보에 대한 이야기를 어딘가에서 전해 듣거나 글로 읽으 면서 정보에 대해 간접적으로만 알게 되는 것이다. 또한 우리는 전 문가의 의견을 신뢰한다.

나는 산소 원자나 물 분자를 한 번도 본 적이 없지만, 엄격하게 실 시된 여러 실험에 대해 설명하는 다수의 문헌을 보고 입자의 존재를 믿게 됐다. 이와 비슷하게 나는 미국인들이 달에 착륙했는지도, 빛 의 속도가 초속 30만km 정도인지도, 저온 살균으로 세균을 정말 죽 일 수 있는지도, 인간의 정상적인 염색체 수가 23쌍인지도 직접 확 인해본 적이 없다. 나는 내가 사는 건물의 엘리베이터가 제대로 만 들어져 관리되고 있는지도, 담당의가 실제로 의대 출신인지도 직접 확인한 바가 없다. 우리는 전문가, 증명서, 면허증, 백과사전, 교과서를 신뢰할 뿐이다. 하지만 우리는 자기 자신은 물론 자신의 분별력과 추리력도 신뢰해야 한다.

우리가 돈을 낭비하거나 이익에 반하는 쪽에 투표하 길 바라는 교활한 거짓말쟁이들은 날조된 정보로 우리를 속이거나, 근거 없는 수치로 우리를 혼란시키며 전문가 행세를 할 것이 다. 자세히 살펴보면 사실상 무의미한 정보로 우리 주의를 끌려고 노력한다. 이 문제에 대한 해결책은 우리가 접하는 갖가지 주장을, 마치 통계치와 그래프를 분석하듯이 분석해보는 것이다.

 

 

 

 

#조건부 확률. 그리고 베이즈 법칙

조건부 확률 통계와 관련된 주장을 살펴볼 때, 사실상 하위 집단을 살펴보고 있는 것인데 불특정인들의 집단 전체를 살펴보고 있다고 착각하는 경우가 많다. 당신이 폐렴에 걸렸을 확률은 얼마일까? 아주 높진 않 을 것이다. 하지만 우리가 당신과 당신의 특수한 상황에 대해 더 많 이 알고 있다면, 그 확률을 더 높게 혹은 더 낮게 추산할 수도 있을 것이다. 이런 확률을 '조건부 확률'이라고 부른다.

조건부 확률은 특별한 표기법이 있다.

당신이 햄버거를 주문한 조건하에서 웨이터가 당신에게 케첩을 가져올 확률은 다음과 같이 적는다.
P (케첩 |햄버거)

여기서 세로 막대 ' | ' 는 뒤에 적혀 있는 사건이 조건임을 나타낸 다. 보다시피 이 표기법에서는 수식이 간결해지도록 일반적인 서술 에 쓰이는 말을 많이 생략한다. 따라서,

당신이 햄버거를 주문하고 케첩을 달라고 요청한 조건하에서 웨이터가 당신에게 케첩을 가져 올 확률은 다음과 같이 표기한다. 
P (케첩 | 햄버거 요청)

(참고)나무위키 |  조건부확률 conditional probability 
조건부확률은 어떤 사건이 일어나는 경우에 다른 사건이 일어날 확률을 말한다. 사건 B가 일어나는 경우에 사건 A가 일어날 확률을 '사건 에 대한 의 조건부확률'이라 하고, P(A∣B)로 표기하며 'P A given B' 또는 'P A bar B'로 읽는다. P(A∣B)는 사건 B의 영향을 받아 변할 수 있으며, 일반적으로 P(A∣B)와 P(B∣A)는 같지 않다.  

조건부 확률의 함정 
조건부확률은 그 특성상 의미를 오해하기 쉽기 때문에 통계로 드러나는 수치는 사실인데 독자가 잘못 받아들여서 의도치 않게 통계의 함정에 걸리기도 한다. 유명한 예시 중의 하나가 몬티 홀 문제.이 함정을 이해하기 위해 다음 예시를 보자.
"자동차 사고로 사망한 사람의 40%는 안전띠를 매지 않았다고 한다. 그런데 뒤집어서 말하면 자동차 사고로 사망한 사람의 60%는 안전띠를 매고도 죽었다는 뜻인데, 그렇다면 안전띠가 더 위험한 것 아닌가? "
이 예시에서 말하는 조건부확률의 함정은 해당 통계가 자동차 사고로 사망한 사람 중에서 안전띠를 맨 사람의 비율이 60%라는 것을 말하고 있는 것을 안전띠를 맸을 때 자동차 사고로 사망할 확률이 더 높다는 식으로 오해하는 것이다. 두 조건부확률 P(A|B)와 P(B|A)가 서로 다르기 때문에 이런 오류가 발생하는 것.


베이즈 정리

베이즈 정리(Bayes' theorem). 어떤 사건이 서로 배반하는 원인 둘에 의해 일어난다고 할 때 실제 사건이 일어났을 때 이것이 두 원인 중 하나일 확률을 구하는 정리를 베이즈의 정리라고 한다.

다만 사후 확률(조건부 확률, 어떤 사건이 만들어 놓은 상황에서, 그 사건이 일어난 후 앞으로 일어나게 될 다른 사건의 가능성을 구하는 것)을 구한다는 점에서 기존 사건들의 확률(사전 확률)을 알고 있어야한 다는 점에 대한 제약이 발생한다. 다만 최근 빅데이터를 통해 관련 내용들을 개선되고 있다. 

무기화된 거짓말. 베이즈 법칙

본문의 문제와 관련해서는 P(G)가 우리가 샘플 검사 결과를 아직 모 를 때 혐의자가 유죄일 사전 확률을 나타내고, P(E)가 혈액 샘플이 일치한다는 증거가 나올 확률을 나타낸다고 해보자. 우리는 P(GIE) 카 얼마인지 알고자 한다. 위 식에 이를 대입해 A 대신 G, B를 넣으면, 다음과 같은 식을 얻을 수 있다.

무기화된 거짓말. 베이즈 법칙 적용 예 1

베이즈 법칙의 공식을 계산해 P(GIE)를 구할 때는 표를 이용하면 도움이 될 수도 있다. 

무기화된 거짓말. 베이즈 법칙 적용 예 2


(참고) 나무위키 | 인지과학에서의 베이즈 정리
심리학신경과학인지과학 등의 분야에서는 베이즈 정리가 바로 인간이 생각하고 판단하는 근본적인 방식일 수도
있겠다고 보는 이론적인 흐름을 낳기도 했다.
이러한 입장은 인지과학 연구자들 사이에서도 의견이 분분한데, 베이즈주의의 관점에서 심리 과정을 연구하는 학자들은 인간의 뇌와 마음에서 일어나는 과정이 정확히 베이즈 정리를 따른다고 가정하기 때문이다. 단순히 인간이 환경에 대해 학습하고 자신의 믿음을 업데이트한다는 주장과, 그 과정이 정확히 베이즈 정리를 따른다는 주장 사이에는 큰 차이가 있다. 또한 베이즈주의 인지과학의 입장은 단순히 인지과학의 여러 분야에서 데이터를 분석하기 위해 베이즈 통계학을 사용하는 것과도 차이가 있다.

이러한 관점에 관심이 있는 심리학자와 신경과학자들은 신경세포의 정보처리 과정이나 행동이 정확히 베이즈 정리에 의해 설명되며 베이즈적인 관점에서 '합리적'임을 모델링을 통해 설명한다.
*(관련 논문 : 심리학에서의 예신경과학에서의 예)
 

베이즈 정리 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 확률론과 통계학에서 베이즈 정리(영어: Bayes’ theorem)는 두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리다. 베이즈 확률론 해석에 따르면

ko.wikipedia.org

베이즈 정리를 설명하는 유튜브 영상 

 

 

 

 

우리가 무엇을 모르는지 알기

아시다시피 세상에는 '알려진 지식known knowns'이 있습니다.
그러니까 우리가 아는 줄 아는 것이 존재하는 거죠.
또 우리는 '알려진 무지 known unknowns'가 있다는 점도 알고 있습니다.
다시 말해, 우리는 세상에 우리가 모르는 것이 존재한다는 걸 알고 있다는 뜻입니다.
그런데 세상에 는 알려지지 않은 무지 unknown unknowns, 즉 우리가 모르는 줄도 모르는 것도 있습니다.

-미국 국방부 장관 도널드 럼스펠드 Donald Rumsfeld


확실히 배배 꼬여 의미를 이해하기가 힘든 말이다. 같은 단어를 저렇게 거듭 써야 할 이유는 없다. 장관이 다음과 같이 말했더라면 그 의미를 좀 더 분명하게 전달할 수 있었을 것이다. “세상에는 우리 가 아는 것도 있고, 우리가 모르는 줄 아는 것도 있고, 우리가 모르 는 줄도 모르는 것 또한 있습니다." 물론 세상에는 이 3가지 말고도 한 가지가 더 있다. 즉 우리가 알고 있는데 그런 줄 모르고 있는 것 도 존재한다. 당신은 아마 이런 경우를 경험해봤을 것이다. 누군가 에게서 질문을 받고 대답을 해준 후에 속으로 이렇게 생각해본 적이 있지 않은가. '내가 그걸 어떻게 알게 됐는지도 잘 모르겠네.'

하지만 둘 중 어느 쪽이든 이야기의 핵심은 타당하다. 당신에게 엄청난 피해와 불편을 끼치게 될 요인은 -이 책의 첫머리에 나오는 마 크 트웨인과 조시 빌링스의 경구대로- 당신이 안다고 생각하지만 실은 모르는 것, 그리고 당면 문제에 매우 밀접히 관련된 사항인데 당신 이 그런 줄도 모르고 있는 것이다. 적절한 과학적 질문을 만들려면, 우리가 아는 것과 우리가 모르는 것을 고려해야 한다. 적절하게 세 운 과학적 가설은 '반증 가능'하다.

진짜 과학자들은 일이 예상대로 진행 되지 않을 때에만 자신이 뭔가를 배우게 된다는 것을 알고 있다. 이상을 요약하면 다음과 같다.

 

1 알려진 지식

세상에는 지구에서 태양까지의 거리처럼 우리가 아는 것들이 있다. 당 신은 관련 자료를 찾아보지 않고서는 답을 내놓지 못할 수도 있지만, 그 답이 이미 알려져 있음을 알고 있다. 이것은 럼스펠드가 말한 '알려진 지식'이다.

2 알려진 무지

세상에는 신경 신호가 기쁨이라는 느낌으로 이어지는 원리처럼 우리가 모르는 것들이 있다. 우리는 우리가 그런 문제에 대한 답을 모른다는 사실을 알고 있다. 이것은 럼스펠드가 말한 '알려진 무지'다.

3 알려지지 않은 지식

세상에는 우리가 알고 있지만 그런 줄 모르고 있는 것 혹은 자기가 안 다는 사실을 잊어버린 것들이 있다. 당신의 할머니가 결혼하기 전에 썼 던 성은 무엇인가? 초등학교 3학년 때 여러분 옆자리에는 누가 앉았 는가? 답을 기억해내는 데 도움이 되는 적절한 실마리를 찾으면, 당신은 자신이 그 답을 알고 있었음을 비로소 알아차리게 된다. 럼스펠드가 언급하진 않았지만, 이것은 알려지지 않은 지식'이다.

4 알려지지 않은 무지

세상에는 우리가 모르는데 그런 줄도 모르고 있는 것들이 있다. 가령 당신이 집을 한 채 샀다고 해보자. 아마 당신은 전문가를 고용해서 지붕과 토대의 상태, 흰개미처럼 목재를 파괴하는 생물의 유무 등에 대한 검사 결과를 보고받았을 것이다. 그런데 만약 당신이 라돈에 대해 들어본 적 이 없다면, 그리고 부동산 중개인이 당신 가족의 건강을 지키는 일보다 거래를 매듭짓는 데 관심이 더 많았다면, 당신은 라돈에 대한 검사를 해 보려고 생각하진 않을 것이다. 하지만 주택 중에는 발암 물질로 알려진 라돈의 농도가 높은 곳이 많다. 이것은 알려지지 않은 무지'로 간주할 수 있다. 물론 당신이 이 단락을 읽고 나면 이것은 더 이상 그 범주에 속 하지 않겠지만 말이다. 가만 보면, 당신이 어떤 무지를 자각하느냐 자각하지 못하느냐는 당신의 전문 지식과 경험에 달렸다. 해충 유무를 검사 하는 전문가는 당신에게 자기는 오로지 보이는 것에 대해서만 보고한다 고 말해줄 것이다. 즉 그는 당신의 집에서 그가 접근할 수 없는 곳에 보 이지 않는 손상부가 있을지도 모른다는 점을 알고 있는 셈이다. 그는 그 잠재적인 손상의 종류와 정도에 대해서는 모르지만, 그런 손상부가 존 재할지도 모른다는 점은 알고 있다(알려진 무지). 만약 당신이 그의 보 고 내용을 맹목적으로 받아들여 그 일이 완료됐다고 생각해버린다면, 당신은 또 다른 손상부가 존재할 수 있다는 점을 인식하지 못하고 있는 셈이다(알려지지 않은 무지).

 

 

 


https://www.ted.com/speakers/daniel_levitin

 

Daniel Levitin | Speaker | TED

Daniel Levitin incorporates findings from neuroscience into everyday life.

www.ted.com

 

댓글