Art & Fashion/패션과 사회

경찰의 여론조작에 관해-통계학의 관점에서 말하다

패션 큐레이터 2009. 1. 29. 20:27

 

산참사를 둘러싸고 경찰의 조직적인 여론조사 개입에 대해 인터넷 광장이 뜨겁습니다. 경찰청에서는 오히려 자발적 참여인데 왜 문제를 삼냐며 또 정치적인 관점으로 풀어가려는 작태를 보이고 있지요. 저는 이 문제에 대해서 정치적 중립을 지킬 생각입니다.

 

다만 마케터로서 오랜동안 시장의 소비자를 상대로 통계작업과 그 추론 및 제품 마케팅에 사용해온 제 관점만을 밝히려고 합니다. 즉 통계적 과정 상의 문제와 현행 공무원법을 빌어서 이 사안에 대한 평가를 하려 합니다.

 

최근 ARS 혹은 인터넷을 통한 여론조사가 활발합니다. TV 토론 프로그램에서는 논제에 관한 시청자의 견해를 ‘찬성/반대’ 또는 ‘허용/불허’의 형식으로 투표에 부치면서 그 결과를 실시각으로 공개하고 있으며, 인터넷신문이나 포털 사이트에서는 거의 예외 없이 초기화면에 사회적으로 논란이 되고 있는 사안에 대해 방문자들의 견해를 묻는 투표 창을 마련하고 있지요. 문제가 된 용산참사란 사안에 대한 100분 토론의 여론조사도 이와 같은 형식의 조사였습니다.

 

100분 토론 초기 ARS 값은 경찰의 강경진압 대신 폭력시위에 대한 여론으로 흘러들어갔다가 후반으로 가면서 후자로 뒤바뀌는 엎치락 뒤치락 하는 웃을 수 없는 결과값이 나왔습니다.


문제는 이와 같은 형식의 여론조사에 참여하는 사람들이 국민 전체를 대표할 수 없음은 주지의 사실입니다. 그 가장 큰 이유는 ′자발적 표집(voluntary sampling)′이라는 비확률적 표집방법을 통해 표본이 결정된다는 문제점 때문입니다. 이건 제 생각이 아니고 통계학 교과서에 나오는 내용입니다. 『Statistics for Business and Economics』Anderson Sweeny Williams 저 참조.

 

비확률적 표집방법이란 통계를 위한 표본을 모을 때, 표본으로 선정될 확률이 알려져 있지 않은 경우를 말합니다. 확률이 알려져 있지 않은 관계로 이 방법에 의해 얻어진 통계량은 정확성을 평가할 수 없습니다. 비확률적 표집방법은 시행하기가 쉽고 비용이 저렴하기 때문에 종종 사용되지만 추정치의 정확도에 대해 통계학적으로 타당한 논평을 할 수 없고, 다만 제품 아이디어를 묻거나 할때 사용됩니다.

 

그런데 100분 토론의 여론조사를 보면 상기의 방식(비확률적 표집방법)을 사용하여 추정값을 내는 데 이 경우 여론조사의 결과는 비참여자들보다 강한 동기를 부여받아 ‘투표’라는 적극적인 행동을 했던 자발적 참여자들만의 의견으로 남게 됩니다. 바로 직접적으로 폭력시위로 포장하고 싶어했던 경찰의 자발적 행위는 그들의 말대로 '정치적 견해를 투명하게 표명'하는 것이 아니라, 자신에게 면죄부를 주기 위한 술책에 불과한 것이지요. 내부 게시판에 여론투표에 적극적으로 임해달라는 소식까지 전해져 거의 전염되듯, 온라인 상에서 표를 던진 것이죠.

 

국가공무원법 제66조 (집단행위의 금지) 1항에 따르면 공무원은 노동운동 기타 공무 이외의 일을 위한 집단적 행위를 하여서는 안됩니다. 경찰청에서 직원들에게 여론에 참여하도록 한 것이 확실하다면 공무원이 지켜야 할 정치적 중립을 스스로 무너뜨린 것이 되는 것 뿐입니다. 게다가 내부게시판을 통한 의견 피력이라고 주장합니다만, 문제는 용산 참사라고 하는 사안에 대해서, 그 대표성과 방법론을 이야기 하기 전에 첨예한 이해 당사자가 여론조사에 참여한다는 것 자체가 데이터 값의 정결성을 깨드리는 것입니다. 통계적인 윤리의 문제를 거론하기에 앞서 그들의 자발적인 여론조작은 바로 공무원법 위반이란 점을 분명히 밝힙니다.

 

한국에서도 이러한 ARS 나 방송을 통한 비확률적 표집 방법의 문제점에 대한 논문은 여러 편 발표되었습니다. 자발적 참여자들이 투표에 강제적으로 참여했던 모집단에 비해, 조사대상 이슈에 대해 상대적으로 부정적인 의견을 가지고 있었다는 논문내용은 매우 의미심장합니다.

 

거의 전염되듯, 자신의 면죄부를 위해, 용산참사를 폭력과격시위로 프레임 하려는 경찰의 노력이었죠. 더 재미있는 건 이런 작금의 현실이 이미 통계학 실험을 통해서 밝혀져 있었다는 것입니다.

 

이 실험의 내용을 읽어보면 흥미로운 결과가 나오는데요. 설문기간 후반보다는 초반에 부정적 의견이 더욱 두드러지게 나타났다는 점입니다. 논문내용을 경찰이 확실하게 증거해 준 셈이죠. 이는 설문이 이루어지는 기간이 짧을수록, 조사 대상 이슈에 대해 부정적 의견을 가진 사람들이 자발적 표본에 포함될 가능성이 높아진다는 의미로 해석할 수 있습니다. 왜 그렇게 사진 속 토마토처럼 모든 사람들의 견해를 붉은색으로만 몰려고 하시나요?


자발적 참여에 의지하는 ARS 또는 인터넷 설문은 가능한 한 장기적으로 집행되어 높은 수준의 응답률을 반드시 확보해야만 합니다. 이것이 없는 지금의 샘플링 방식은 전혀 모집단이 가지고 있는 정확한 의사내용을 알수 없다는 것이죠. 그리고 설사 장기간에 걸쳐 높은 응답률을 얻더라도, 설문기간 초기에는 그 결과를 공개하지 않는 것이 바람직하다고 통계학자들은 말합니다. 편향된 표본의 왜곡 된 여론이 차후 설문 참여자들의 의견형성에 바람직하지 않은 영향을 미칠 것이기 때문이지요.

 

경찰에게 묻고 싶습니다. 아고라에서 경찰의 여론조사 개입을 옹호하는 분들의 견해를 보면 의사 개진 과정이 자발적이었기에 문제가 없다고 말합니다. 정치적 성향이나 관점, 혹은 이데올로기를 떠나, 미안하게도 그러한 자발성 때문에 데이터 값이 타당하지 못하다는 겁니다.

 

특히 경찰처럼 철저한 위계와 계서제 조직에서 상부에서 하달된 '각 사이트 마다 돌아다니며 투표를 격려' 하라는 명령에 대해, 철저하게 투표자 개인이 '통계적 독립성'과 '적합성'을 따져 물어도 문제없을 만큼, 독립된 의사표명을 했다고 보기 어려운 까닭입니다.

 

이상 논평을 마칩니다. 어디를 봐도 제가 정치적으로 치우친 견해를 내 놓았다고 생각되진 않네요. 다만 자료와 데이터의 정확성을 찾고 이를 바탕으로 정확한 의사결정을 하는 정부가 되고, 관료가 되길 바랄 뿐입니다.