5월9일 대통령선거가 다가오며 여론조사에 대한 관심이 높다. 여론조사 결과에 대한 해석이 난무한 상황에서 응답률과 유무선 비율의 상관관계는 무엇인지 짚고 넘어가 보고자 한다.
▲여론조사 응답률이란?
우선 응답률의 정의를 알아야 한다. 예를 들어 응답률 10%로 공표된 1,000샘플 여론조사를 가정해보자. 선거관리위원회 기준에 따르면 응답률 10%의 의미는 1,000건의 완료응답을 얻기 위해 수신된 전화가 10,000건이라는 뜻이다. 응답률이 5%라면 1,000샘플을 얻기 위해 20,000건의 수신된 전화가 있었다는 의미다. 그렇다면, 5%와 10%의 여론조사 중에서 어떤 여론조사가 정확할까?
보통은 높은 응답률의 여론조사가 정확하다고 말한다. 또는 미국의 사례를 들어서 높은 응답률 조사가 정확하다고 말한다. 이유는 다음과 같다. 10% 응답률 여론조사는 수신된 10,000명 중에서 9,000명의 여론이 미반영된 여론조사이고, 5% 응답률 여론조사는 수신된 20,000명 중에서 19,000명의 여론이 미반영된 것으로, 산술적으로 중도이탈자가 적은 여론조사가 여론에 대한 청취를 상대적으로 더 잘한 것으로 해석하는 것이다.
일부 옳은 주장이다. 응답률이 낮으면 이탈자가 많기 때문에 완료응답 여론과 이탈자의 여론 사이에 왜곡이 생길 수 있기 때문이다. 하지만, 모집단을 놓고 보면 이야기가 달라진다. 전국을 대상으로 하는 대통령선거의 유권자 모집단은 약 4,200만명이다. 결국, 4,200만명에서 10% 응답률의 중도이탈자 9,000명의 비율은 0.0002%이고, 5% 응답률의 중도이탈자 19,000명의 비율은 0.0004%다. 즉. 전국조사라는 단위를 기준으로 보면, 0.001%도 아닌 차이를 정확도의 근거로 얘기하는 것은 조금 과한 해석이 아닐까 싶다. 결국 여론조사의 정확도는 조사에 응답하지 않거나 중도이탈한 사람들의 절대적 숫자가 아니라, 응답한 사람들이 얼마나 모집단을 충실하게 반영했는가에 달려있다.
높은 응답률의 여론조사가 정확하다는 평에는 항상 미국의 사례가 따른다. 하지만 미국과 한국은 조사환경이 매우 다르다. 일반적으로 미국은 조사샘플을 모집할 때 우리나라와 달리 성, 연령, 지역 같은 요소뿐 아니라 소득, 학력, 정치 성향까지 다양하게 고려해 얻어진 전화번호 리스트를 사용해 모집단의 성향을 정확하게 반영하려고 한다. 얻어진 샘플들과 비교해 조사에 응답하지 않은 사람들의 성향에 대한 통계적 추정도 가능하다.
하지만 우리나라의 경우 2010년 지방선거 이래 유선RDD(Random Digit Dialing)를 도입했고, 무선RDD까지 가세한 상황이다. RDD는 ‘무작위전화걸기’라는 뜻으로 응답자에 대한 어떠한 정보도 포함하지 않는다. 따라서 유권자의 성향에 대한 분석 및 관리는 불가능하다.
결국 정확한 여론조사는 단순히 응답률만 높은 여론조사가 아니다. 정확한 조사는 중도이탈을 했거나 응답을 거부한 사람들에 대한 분석까지 가능할 수 있는 조사가 정확한 여론조사인 것이다. 하지만 국내 여론조사 공표 기준에는 이탈자 또는 응답 거부자에 대한 판별분석이 불가능하게 되어 있어 수신된 완료응답에 대한 기본 가중 결과만 공표하게 되어 있다. 이점에 대해서는 관련 주체간의 논의와 합의가 필요한 부분이다.
▲유무선 비율이 왜 문제가 될까?
유무선 비율 역시도 세간의 화제다. 유선전화와 무선전화 수신자의 연령별 비중 차이가 원인인데, 보통 유선전화를 통해 응답한 사람은 고연령층이 많아 보수적이고, 무선 전화는 저연령층 수신이 많기 때문에 개방적 또는 진보적이라고 말한다.
결국, 유선이기 때문에 보수이고, 무선이기 때문에 진보라는 말은 성립 하지 않는 억지 주장이다. 유선과 무선은 정치적 이념 성향이 아닌 여론조사 결과를 얻기 위한 수단에 불과하다. 유선 100%, 유무선 각 50%, 무선 100%의 조사에서 결과의 차이는 없는 것이 정상이다. 가장 중요한 원칙은 4,200만의 유권자. 즉 모집단에서 연령별로, 성별로, 지역별로 어떻게 고르게 여론을 수신했는가가 제1원칙인 셈이다.
현재 국내 유선전화 가구 수는 과거에 비해 크게 낮아지고 있으며, 무선전화 가입자의 수는 급상승하여 1인 1휴대전화 시대에 들어왔다. 더욱이 집에 유선전화가 없는 가구 수도 매우 많다.
하나씩 짚어보자. 서울에 위치한 유권자 15만의 국회의원 선거구를 예를 들면, 유선전화만으로 여론조사를 할 경우는 30대 이하가 거의 수신되지 않는다. 이유는 앞서 거론했듯이 가구에 집 전화가 없기 때문이다. 이런 경우 유선만으로 여론조사를 하면 결과가 크게 왜곡될 것이다. 이와 반대로, 전남, 경남, 경북, 전북의 경우에는 어떨까? 수도권보다 월등히 높은 유선전화 가입률을 보이기 때문에 유선조사 100%만으로도 실제 결과에 근접한 여론조사 결과를 도출할 수 있다.
따라서 여론조사에서 유무선의 차이는 연령별로 완료응답을 얼마나 더 충실하게 얻기 위한 수단의 차이이지 유선 응답자와 무선 응답자의 이념 차이가 드러나는 것이 아니다. 전국 4,200만을 대상으로 하는 대통령선거에서는 더더욱 차이가 나지 않는다.
그렇다면 이번 대선에서 유선과 무선의 비율이 논쟁 된 배경은 무엇일까? 무선 100%와 유무선 각 50%의 차이가 나는 이유는 무엇일까. 이유는 단 하나다. 무선 100%의 조사와 유무선 50%의 조사에서 모집단의 수. 즉 성별, 연령, 지역별의 펙터는 선관위의 규정에 맞는 여론조사지만 유권자 4200만의 모집단 중 연령별로 대선에 대한 관심정도의 차이가 크기 때문이다. 다시 말하면 3-way(성, 연령, 지역)기준에는 적합할 수 있겠지만 모집단에서 차지하는, 여론조사 응답자의 정치성향비율 차이가 크게 기울어져 있기 때문이다.
즉, 대통령 탄핵과 초유의 대선 보궐선거가 사라진 보수층을 만들었고, 여론조사 환경을 매우 어렵게 만들었다. 따라서 사라진 보수층을 어떻게든 1,000샘플의 여론조사에 담아내기 위해 노력하는 자세가 여론조사 전문가의 자세인 것이다. 지난 JTBC 팩트체크에서도 거론했듯이 정확한 여론조사는 응답률과 유무선 비율에 달린 것이 아니라 결과에 모집단을 정확하게 반영한 여론조사라는 사실이다.
조원씨앤아이 대표 김대진