2014년 1월 30일 목요일

Should every chart start at 0?

R-bloggers에서 Economic Policy Institute의 차트가 가로축의 범위를 이상하게 둠으로써, 독자를 호도한다고 비판했는데, 글쎄 나라면 이번 경우에 EPI의 편을 들고 싶다.

1. Original Chart from EPI

아래와 같은 차트를 제시하고 이것에 대해서 2008-2010년 기간동안에 Empolyment-to-Population 비율이 급락 (ski jump) 했다고 묘사.


2. Revised Chart from R-blogger

이것에 대해서 R-bloggers는 가로축의 범위가 74~82 % 범위에서 그려졌는데, 이것을 0~100%로 그리면 완전히 다른 이미지가 된다는 것


이들은 이 차트에서 보듯 하락은 했지만 어쨋든 스키점프는 존재하지 않는다고 하면서, 대놓고 주장하지는 않지만 EPI의 차트는 일종의 사기에 가깝다는 것을 암시.

3. 적절한 범위. 0~100%?

일단 나는 백분율로 표현되든 지표에 대해서 반드시 0~100% 구간으로 그림을 그려야 한다는 주장에 대해서는 전혀 동의하지 않는다. 예컨데 경향신문에 보도된 청년실업율 그래프를 보자


이 차트는 가로축의 출발점이 얼마인지가 정확하게 표현되어 있지는 않은데, 7.5에서 10.0 사이의 거리랑 비교해보면, 대략 6정도 아닐까? 이 차트는 2012년 12월 이후 짧은 시기에 급등한 것을 나타내기 위해서 그린 것인데, 이것을 0에서 출발하는 차트로 해보면 어떨까?


큰 변화는 없어 보이고, 그래도 2012년 12월 이후 어느정도 상승했다는 것은 포착된다. 그런데 이것을 사실 R-bloggers의 취지에 맞게 그리려면 세로축의 범위를 단순히 0에서 출발하는 게 아니라 100에서 끝나도록 해야한다.


이런 식으로 그리면 사실 아무 의미없는 차트가 된다. 거의 어떤 변화도 느껴지지 않는. 과연 이게 올바른 비쥬얼라이제이션일까? 나는 그렇게 생각하지 않는다.

4. 적절한 범위. 역사적 최소값에서 역사적 최대값?

어쩌면 R-bloggers가 보기엔, 여성 employment-to-population의 경우처럼, 50%를 갓 넘은 시기도 있었으니, 최소한 EPI가 그린 차트보다는 더 가로축의 범위를 확장해야 한다고 생각할지도 모른다. 나는 이렇게 주장한다고 해도 별로다. 굉장히 긴 시기에 걸친 제도적/문화적 변화에 따른 변화를 반영한 것인데, 단기간에 변동을 묘사하기 위해 이런 것을 고려하는 것은 부적절하다는 생각.

5. 내용에 따라 가로축의 범위가 정해져야

그런 점에서 난 EPI가 묘사한 "급락"이라는 표현에 동의하는 분도 있고, 동의하지 않는 분도 있겠으나, 노동경제학에 익숙한 분들이 알아서 쓰거나 말거나 할 수있는 표현이라고 생각한다.

또 다른 예를 들어보면 OECD 국가들의 GINI 계수를 비교하는 차트를 그린다면 나는 대략 0.25에서 0.4 정도의 범위로 그릴 것이다. 이것을 0~1로 그린다면 각국간의 차이는 거의 포착이 안될 것인데, 분배에 대해서 조금이라도 관심 있는 분들은 알겠지만, 0.25정도되는 북구유럽과 0.38정도되는 미국의 분배상태는 넘사벽이다. 예컨데 영국/미국이 OECD 평균에 비해 얼마나 불평등이 심한가를 보이기 위해 그린 아래 차트를 보자,


이것을 만약에 0~1의 범위에 그리면 어떻게 될까? 미국도 영국도 OECD평균도 하나로 뭉쳐져서 차이를 발견하기 힘들 것이다. 그래서 분배상태는 다 그게 그거다? 그래서 나는 이것을 뚜렷하게 보이기 위해서 0~1의 범위를 포기하는 것을 문제라고는 조금도 생각하지 않는다.

차트는 0에서 출발해야 한다는 주장은, R-bloggers의 포스팅 외에도 가끔 마주치게 되는데, 근거가 전혀 없다고 생각.....

댓글 없음:

댓글 쓰기