본문 바로가기

National Doragraphycs/시사

통계의 진실과 거짓

통계의 진실과 거짓

출처<연합뉴스>



11월 30일발 해럴드 생생뉴스에서는 박근혜와 문재인의 지지율 대결에서 박근혜 51.0%, 문재인 후보 41.8%(표준오차 95% 오차범위 2.03%)로 박 후보가 우세하다고 적었다. 그러나 이 통계는 헛점이 몇 가지 있어 신뢰도가 낮다. 

우선 응답률이 없다. 총 응답자가 2310명이라고 명기되어 있지만 전체 몇 명에게 전화를 걸어 그만큼의 응답자가 산출되었는지 모른다. 응답률이 30%가 안될 경우에는 설문 자체의 유의성이 부족하기 때문에 통계로서 가치는 떨어진다.

두 번째, 어느 시간대에 어느 지역을 표본으로 했는지 알 수 없다. 기사 내용을 살펴보면 전국적으로 실행했다는 것을 짐작할 수 있는 내용이 있지만, 어디까지나 그것은 독자의 짐작일 뿐 어느 지역을 대상으로 했는지 쓰여 있지 않다. 또한 어느 시간대에 했는지에 따라 지지율이 달리 나올 수 있기 때문이 이것도 신뢰도를 떨어트리는 요인이다.

세 번째, 무작위 일반전화 RDD방식이 과연 형평성이 있는가이다. 젊은 층들은 대체적으로 외출이 잦으며 집전화를 설치하지 않는 경우도 비일비재하다. 집에서 전화를 받을 수 있는 사람들은 상대적으로 나이가 많은 사람들인데, 나이가 많을 수록 여당 지지율이 높기 때문에 과연 이 방식이 믿을 만한가에 대한 의문이 든다.

결론. 통계자료로서 의미가 별로 없는 통계 조사를 기사화하는 것은 노골적으로 문재인 후보를 불리한 기사를 배포한 것이다. 혹은 통계는 정확했지만 기자가 명시할 것을 잘 몰랐다던가. 어느쪽 가설을 하더라도 언론으로서 해럴드생생뉴스가 제대로 작동하는가를 묻지 않을 수 없다. 

밑에 링크는 참고했던 까페.

http://cafe.naver.com/grefi/20478