美대선 ‘벌벌 떠는 여론조사 회사들’ 이번엔 맞다는 이유?_빙고 가사_krvip

美대선 ‘벌벌 떠는 여론조사 회사들’ 이번엔 맞다는 이유?_온라인 빙고 게임_krvip


2016년 11월 9일 밤 8시 22분. 대통령 선거 당일 밤 뉴욕타임스는 클린턴의 승리를 예상한다. 확률은 82%. 사실상 끝난 것 같던 선거가 완전히 달라져 버렸다. 모두가 알다시피 지금 대통령은 힐러리 클린턴이 아닌 도널드 트럼프다.

뉴욕타임스의 2016년 11월 9일 밤 8시 22분 트윗
"Live forecast: Hillary Clinton has an 82% chance of becoming president, as of 8:22 p.m."

대부분의 여론조사 기관들이 클린턴의 당선을 예상했던 2016년, 트럼프 당선 뒤 대 충격에 휩싸였다. 이후 여론조사 불신은 기존 미디어에 대한 불신과 함께 트럼프 진영의 무기기 되기도 했다. 사회 전반의 정보에 대한 불신을 높이는 계기가 되었다는 분석까지 있다. 그리고 4년이 흘렀다.


이번에도 여론조사 기관-언론은 트럼프 패배 예상

영국의 이코노미스트지는 트럼프의 재선 확률을 4%, 바이든 당선 확률을 96%로 본다. 다른 여론조사 기관들도 이번에도 트럼프의 패배를 점친다. 월스트리트저널과 NBC의 마지막 공동 여론조사에서 바이든은 트럼프를 10포인트 차로 리드하고 있다고 보도했다. 영국의 가디언은 10월 29일 기준으로 여론조사 지지율 평균 격차가 7.4%에 이른다고 했다. 바이든 51%대 트럼프 43%.

이 정도면 끝난 게임으로 봐야 하지만 사람들은 여전히 의구심일 가진다. 아직 결과는 알 수 없다, 2016년에도 그랬다.

2016년 여론조사 때는 무슨 일이? 거대한 실패의 이면

① 여론조사 실패가 아니라 선거인단제도의 특징

뜻밖에도 월스트리트 저널은 '미국 여론조사협회'를 인용해 2016년 여론조사가 틀리지 않았고 오히려 '지난 80년간의 전국단위 여론조사 가운데 가장 정확했다'고 보도했다. 당시 여론조사를 종합하면 클린턴 후보가 트럼프를 3%p 이긴다는 결과를 냈는데, 실제로도 대부분의 여론조사 오차 범위 안인 2%p 이긴 것으로 나왔다는 것.

그러니까 전국 여론조사는 맞았다고 봐야 한다는 이야기다. 다만 부분적으로 부정확한 부분이 있었고, 그 부분적 부정확함이 승부를 가르는 이유는 미국 선거인단 제도의 특징이다. 대부분 주(State)가 주별로 승자를 결정하고 승자에게 선거인단을 몰아주는 승자독식 방식(Winner take all)이다 보니 부분적 부정확함의 결과는 심대할 수 있다.

실제로 그런 일이 2016년 일어났다. 주 단위에선 격차가 1%가 되지 않는 접전이 많았고 이 접전 주에서 이 같은 부정확성이 결과를 바꿔놓았다.

②부분적 부정확성의 이유
-표본 추출 오류와 지지후보 결정 지연 문제

월스트리트 저널은 펜실베이니아 주와 미 중서부 지역에서의 부정확성이 치명적인 결과로 이어졌다고 본다. 공론화위원회를 인용해 여론조사 표본에 '대졸자가 너무 많이 포함된 반면, 노동자(Working class)나 4년제 학위가 없는 사람들이 너무 적게 들어간 문제'가 있었다고 밝혔다. 교외 지역 유권자(Rural voters) 과소 측정도 있었다. 결과적으로 클린턴 지지자가 모집단보다 더 많이 포함되었다.

여론조사는 모집단을 정확하게 반영하기 위해서 무작위 표본을 추출한다. 통계적으로 무작위 표본 추출이 되었다면 당연히 오차확률 안에서 모집단의 성격을 반영한다고 보는 것인데, '무작위 표본 추출'에 실패했다는 의미다.

게다가 지지 여부 결정도 지연되었다. 많은 유권자가 마지막 주가 되어서야 지지후보를 결정했다. 위스콘신, 플로리다, 펜실베이니아에서 이 비율은 13%에 이르렀는데, 이 표가 트럼프 쪽으로 쏠렸다. 끝까지 어느 당도 지지하지 않는 무당파층 역시 두꺼웠는데, 당시 월스트리트저널과 NBC의 마지막 공동 여론조사에서 이 비율이 16%에 이르렀다.

③ 적극 투표자 구분의 문제

여론조사에는 포함되지만, 투표장에 가지 않는 유권자 문제도 있다. 실제 지지 여부를 잘못 측정한 게 아니지만, 결과적으로 투표에는 반영되지 않았으므로 '투표자'라는 모집단을 정확하게 반영하는 데는 실패한다. 뉴욕타임스 등 미 언론은 당시 '클린턴 후보의 비호감도'가 극도로 높았고 이 때문에 민주당과 클린턴을 지지하지만, 투표장에 가지 않은 사람들이 많았을 것으로 분석했다.

2020년 여론조사는 다르다는 이유


① 격차가 크다

2016년 클린턴은 여론조사에선 평균적으로 3% 정도 리드하고 있었지만, 실제론 2% 리드에 그쳤다. 그러면서 지역적으로 2% 이하의 격차로 격전지 대부분을 잃었다.

하지만 바이든은 거의 두 자릿수 가까운 리드를 기록하고 있다. 이 정도 격차는 '안전마진' 밖이라는 평가가 나온다. 2008년 오바마 대통령 당선 당시 오바마는 7% 앞섰는데, 바이든은 일부 조사에서 이보다 더 많이 앞서고 있다. 3~4% 앞섰던 클린턴에 비해서도 4%p 더 앞서고 있는 셈이니 격차는 2016년과 비교할 수 없다.

영국의 가디언은 29일 여론조사를 종합하며 대부분의 경합 주에서도 바이든이 이기고 있다고 보도했다. 전국 평균에서 7.4% 앞설 뿐 아니라, 플로리다에선 평균 1.9%, 펜실베이니아에선 5.8%, 미시간 8.4%, 위스콘신 7.8%, 노스캐롤라이나 2.1%다.

이런 여론조사들에 바탕을 둬, 선거분석 웹사이트인 ‘파이프서티에잇’(538)은 바이든이 승리할 확률을 89%(트럼프 13%)로 잡았다. 앞서 보았듯 이코노미스트지는 96%로 본다.

② 표본 추출 실패를 보완했다

이런 문제를 보완하기 위해 몇몇 조사 기관들은 교육 수준에 가중치를 둬 고졸 이하 응답자 비중을 늘리고 대졸 이상 응답자 비중을 떨어뜨렸다. 퓨리서치센터는 각 인종 그룹별 교육수준에까지 가중치를 부여했다.

다양한 심리 조사 기법을 통해 지지 후보와 적극성을 분류하는 기술 등 새로운 기법도 대거 등장했다. 이 결과 지난 2018년 중간선거 적중률을 높였다. 또 경합 주에서도 더 정밀하고 품질 좋은 여론조사가 많이 시행되었다. 만약 이번에도 틀린다면 어쩌면 문 닫아야 할 지도 모를 여론조사 기관들, 절치부심한 만큼 틀리지 않을 것이라고 장담한다.

③ 막판 부동표가 적다

이미 많은 사람이 투표를 마쳤다. 사전투표만 9천8백만 표. 코로나 상황으로 인해 지난 대선보다 50% 넘게 늘었다. 사전투표 급증의 의미는 두 가지다. 하나는 민주당의 굳은 표가 많다는 것. 사전투표는 전통적으로 민주당 지지자가 많고 이번에도 그렇다. 다른 하나는 '마지막 순간에 마음을 정하는' 유권자 수가 적어졌다는 점. 지난 대선 여론조사 오차를 크게 했던 요인이 줄었다.

적극 투표층 요소가 영향 줄 가능성이 작다. 우선 부동층은 4년 전의 절반에 불과하고, 사전투표 열기에서 보듯 투표 자체가 급증했다. 이번 대선 투표율이 1908년(65.4%) 이래 최고를 기록할 수 있다는 전망까지 나온다.

게다가 바이든은 클린턴처럼 비호감도가 높은 후보가 아니다. 당시 클린턴의 비호감도는 54%에 달했지만, 바이든은 호감도가 50%를 넘는다. 바이든을 찍으려는 유권자는 투표를 포기할 가능성이 4년 전보다 낮다.

④ 오히려 이번엔 공화당 텃밭에서 이변이 일어날 수 있다

일부 격차가 좁기는 하지만, 몇 개 주에서만 승세를 확정 지어도 과반 선거인단을 확보하는 만큼 현재 바이든의 승세가 확연하다는 여론조사 업체들의 판단은 나아가 이번 대선에선 트럼프가 선거인단 제도의 피해를 볼 수 있다는 판단에 이른다.

지난 대선에서 트럼프는 플로리다를 포함한 4개 주에서 2% 이내의 우위로 선거인단을 대거 가져갔는데, 이번엔 조지아나 텍사스 같은 전통적 공화당 텃밭 지역에서 민주당이 선거인단을 확보하는 '반대 상황'이 연출될 수도 있다고 본다. 그만큼 여론 조사상 격차는 크다.

4년 전에 이어 다시 한번 '바이든의 확연한 우세'를 점치는 미국의 여론조사 기관들, 과연 이번에는 정말 맞을까.