2014년 4월 5일 토요일

스트라이크와 볼 그 체계적 오심.

요 며칠 사이에 메이저리그 경기의 스트라이크와 볼의 판정에 대한 두건의 분석이 New York Times (March 30)와 FiveThirtyEight (April 3)에 기사화되었다. 두건 다 프로페셔널 경영학자들의 논문을 대중적으로 소개한 것인데, 그 자체로 흥미롭기도 하고 사실 예전에 유사한 소개를 포스팅하려고 한 적이 있었는데 차일피일하다가 미루었던 것도 있고 해서, 이번 기회에 간단하게 요약 정리해 둔다.

1. 백그라운드

공식적인 스트라이크 존은 횡적으로는 홈플레이트의 좌우경계를, 종적으로는 어깨/허리의 중간선과 무릎선으로 구성되는 직사각형의 영역이다.

Source: Strike Zone in Wikipedia.

문제는 스트라이크 존을 통과하지 않은 공이 스트라이크로 잘못 판정되거나(Over-Recognition), 반대로 스트라이크 존을 통과한 공이 볼로 잘못 판정되는 경우(Under-Recognition)이다. 이것은 인간이 하는 일이니, 불가피하다고 할 수 있는데, 이 오심은 어느정도 자주 일어나는가하는 것과, 이러한 오심이 어떤 경향성을 띄는가 하는 것이 관심의 영역이다.

이 오심에 대해선 야구 초창기부터 수많은 예상과 억측이 있었는데, 메이저리그에서는 2007년부터 Pitch f/x라고 해서 정밀 카레라를 통해서 모든 투구를 1cm 이내의 오차로 기록하기 시작했다. 이것이 몇년간 쌓여서 엄청난 양이 축적되었고, 이를 이용한 다양한 분석들이 등장하기 시작했다. 여기에서 소개하는 모든 분석과 기사는 다 이 Pitch f/x 자료를 이용한 것들이다.

2. 투수의 지위 (Status of Pitcher)

콜롬비아 경영대학의 김원용 교수와 켈로그 스쿨의 Brayden King 교수의 "Seeing Stars: Matthew Effects and Status Bias in Major League Baseball Umpiring" (forthcoming Management Science, Link for Downloadable Working Paper in PDF)는 투수의 지위가 심판의 스트라이크/볼 판정에 영향을 미치는가를 분석한 것이다. 저자들은 이 논문을 요약해서 New York Times"What Umpires Get Wrong"이라는 기사로 실었다.

이들은 투수의 지위를 측정하는 변수로 과거의 올스타전 참여 횟수를, 제구력이 높은 투수라는 명성을 측정하기 위해서 과거의 사구 (base-on-balls) 허용율을 선택했다. 그리고 홈경기 여부, 관객수, 투수의 메이저리그 참여연도 등 다양한 변수를 콘트롤하였다. 핵심 결론은 투수의 지위가 높을수록 주심은 투수에게 유리한 판정을 내리는 경향이 있다는 것.

우선 Over-Recognition을 살펴보자.

Source: King and Kim (forthcoming)

세로축은 over-recognition의 확률이고, 가로축은 사구 허용율이다. 그림에서 보듯 올스타전에 참가한 경험이 많을수록 실제 투구가 볼이었음에도 스트라이크로 판정을 받아낼 가능성이 컸다. 다만, 사구 허용율이 높은 투수들 사이에서는 올스타전 참여 여부가 유리하게 작동하는 효과가 사라졌다. 결국 투수가 제구력이 높다고 알려져있고, 올스타전에 참여한 경험이 있을 때, 매우 유리하다는 것을 알 수 있다.

다음으로 Under-Recognitiond을 살펴보자.

Source: King and Kim (forthcoming)

이 차트의 세로축은 under-recognition의 확률이고, 가로축은 실제 투구가 스트라이크 존의 경계에서 얼마나 떨어졌는가를 측정한 것이다. 그러니까 왼쪽에 있을 수록 아슬아슬하게 스트라이크 존을 통과한 것이고, 오른쪽으로 갈 수록 스트라이크 존의 한가운데로 들어온 것을 의미한다. 이번에도 over-recognition만큼은 아니지만, 올스타전에 참여한 경험이 많은 투수는 스트라이크를 던지고도 볼로 판정을 받는 억울한 상황에 처할 확률이 낮았다. 그리고 당연하게도 이 차이는 경계선 상에서 아슬아슬할 때 유리하게 작동했고, 스트라이크 존의 한가운데로 들어온 공은 지위가 높은 투수건 그렇지 않은 투수건 스트라이크로 판정될 확률이 극히 낮았다.

3. Impact Aversion

스탠포드 경영대학원생인 Etan Green과 David P. Daniels는 지난 2월 개최된 제8차 MIT Sloan Sprots Analytics Conference에서 "What Does it Take to Call a Strike? Three Biases in Umpire Decision Making" (Downloadable Paper in PDF)이라는 논문을 발표했고, 이를 요약해서 FiveThirtyEight"Four Strikes And You’re Out"으로 기고하였다. 이 논문의 핵심은 현재의 볼카운트가 주심의 스트라이크/볼 판정에 영향을 미치는가 하는 것이었다.

일단 출발점으로 아래의 차트를 먼저 보자.

Source: Green and Daniels (2014)

이 그림의 vertical axis라고 하는 축은 스트라이크 존의 세로방향, horizontal axis라고 하는 것은 가로방향을 의미한다. 붉은 색 라인이 실제 스트라이크 존이고, 0은 스트라이크 존의 중간을 의미한다. 그리고 차트의 높이는 스트라이크로 판정을 받을 확률로 붉은 색은 1에 가까운 것이고, 푸른색은 0에 가까운 것이다. 그림에서 보듯 실제 스트라이크 존의 외부로 갈수록 푸른색이 짙어지고, 스트라이크 존의 한가운에로 가면 붉은 색이 짙어지는 것을 확인할 수 있다.

자 이제 3-볼인 상태여서 볼 하나가 추가되면 사구로 되는 그런 상황을 생각해 보자. 이때도 주심은 평상시와 동일하게 판정을 할까? 만약 그렇다면 3-볼인 상황에서의 차트도 위의 차트와 동일할 것이다. 그런데 실제 데이터로 그려보면, 다르게 나타난다. 아래 그림은 그 차이를 보여주는 것이다.

Source: Green and Daniels (2014)

이 차트의 높이는 대체로 0 또는 양의 값을 갖는데, 그 의미는 이렇게 해석할 수 있다. 일반적인 상황에 비해 3-볼인 상황에서 스트라이크 판정을 더 받게 될 가능성이다. 차트 아래쪽에 붉은 색 사각형이 스트라이크 존인데 존의 경계에서 특별히 그 값이 높다는 것을 알 수 있다. 그러니까 주심은 3-볼인 상황에서 평상시보다 더 스트라이크를 남발하는데, 경계에서 확실히 벗어나서 누가 봐도 볼이거나, 한가운데 들어와서 분명이 스트라이크거나 한 경우는 차이가 거의 없지만, 경계상에 애매할 때는 평상시보다 더 스트라이크로 판정하는 경향이 있다는 것.

이것과 대칭적인 상황은 2-스트라이크인 경우로, 이때는 스트라이크 판정을 받으면 삼진 아웃된다. 이 때는 위와 정반대로 심판은 스트라이크 판정을 매우 엄격하게 한다.

Source: Green and Daniels (2014)

이번에는 차트의 높이가 대체로 0 또는 그 이하의 영역이다. 차트 윗부분의 붉은색으로 표시된 스트라이크 존을 염두에 두고 보면, 이번에는 완전히 벗어나거나 한가운데로 들어오는 분명한 경우는 일상적인 상황과 2-스트라이크 상황이 차이가 없지만, 경계에 있을 때는 2-스트라이크인 상황에서 스트라이크 판정은 평상시보다 낮아진다는 것을 알 수 있다.

이것은 관객이 기대하는 바, 그리고 심판들도 받아들이고 있는 바, "경기가 심판에 의해서 결정되어서는 안된다"라는 암묵적인 어떤 것을 반영하고 있는 것이다. 만약 2-스트라이크인 상황에서 오심으로 스트라이크를 볼로 판정해도 큰 반발은 없겠지만, 오심으로 볼을 스트라이크로 판정해서 선수가 아웃이 된다면 그 파장은 엄청날 것이다 (심판이 결정했다!). 3-볼인 상황은 정확히 반대이고. 그래서 심판은 자신의 판정이 큰 영향을 미치는 것을 피하기 위해 (Impact Aversion) 스트라이크/볼 판정을 할 때 현재의 볼카운트에 영향을 받게 되는 것이다.

그런데 사실 이 impact aversion에 대한 분석은 이번에 처음 수행된 것이 아니다. Tobias J. Moskowitz가 2011년에 출간한 Scorecasting에도 이것과 거의 유사한 분석이 등장한다. 다만 차트 표현만 다를 뿐. 이것을 살펴보자.


Source: Moskowitz (2011)

여기에서 직사각형 영역이 공식 스트라이크 존이다. 그리고 둥그런 부분은 현실의 스트라이크 존으로 부를 수 있는 것인데, 해당 영역에 공이 들어왔을 경우 50% 이상 실제 스트라이크  판정을 받은 영역이다. 안쪽의 빗금 친 영역은 2-스트라이크인 상황이고, 바깥의 큰 원은 3-볼인 상황이다. 두 영역의 차이인 색칠을 한 도넛 부분을 해석하자면, 여기에 공이 올 경우 2-스트라이크인 상황이라면 볼로 판정을 받을 확률이 50% 이상이고, 반대로 3-볼인 상황이라면 스트라이크로 판정을 받을 확률이 50% 이상이다라는 것.

약간의 차이가 있으나 Green-Daniels의 3-dimensional heat map과 Moskowitz의 평면도는 전달하고자 하는 내용이 거의 같은데, 전자가 훨씬 팬시해보이긴 하지만, 오히려 설명하기 더 어려운 듯. 나 개인적으로는 과거에 Moskowitz의 책을 읽은 바 있고, Pitch f/x가 뭔지 익숙한 상황이니까 Green-Daniels의 글이 쉽게 이해가 갔지, 그렇지 않은 경우라면 몇번을 갸우뚱 했을 듯. 좌우간 차트의 핵심이 "멋져보이는 것"이 아니라는 것은 분명.

4. 그리고....

야구에서 비디오 판정이 확대되고 있지만, 스트라이크와 볼의 판정은 전적으로 주심의 육안판정에 의존한다. 이 이유는 뭘까? 잘 모르겠다. 앞에서도 말했지만 현재도 매 투구의 위치를 정확하게 기록하고 있기 때문에 기술적으로 불가능한 것은 아니다. 사실 투수가 공을 던지고 공이 홈플레이트를 지나는 순간 심판은 그냥 멀뚱히 서있고, 기계판정에 의해서 보드에 스트라이크/볼이 표시되고 이것을 장내 아나운서가 선언하는 것은 현재 기술로도 그냥 가능한데.

인간미를 보여주기 위해서? 오심도 게임의 일부라는 옛 경구 때문에?

댓글 없음:

댓글 쓰기