[야구상식] 피타고리안 승률에 대하여 (1)

반응형

팀의 득점과 실점만으로 승률을 예측할 수 있다면 어떨까요? 피타고리안 승률은 간단한 수학 공식으로 팀의 진정한 실력을 드러냅니다.

 

오늘은 야구 분석에서 빼놓을 수 없는 중요한 통계적 개념인 '피타고리안 승률'에 대해 알아보려 합니다. 세이버메트릭스의 핵심 지표 중 하나인 이 개념은 단순한 수식이지만 놀라운 예측력을 보여주어 야구 팬들과 분석가들 사이에서 널리 활용되고 있습니다. 득점과 실점이라는 기본적인 데이터만으로 팀의 승률을 예측할 수 있다는 점에서 매력적인 이 공식이 어떻게 작동하고, 실제 승률과는 어떤 관계가 있는지 심층적으로 살펴보겠습니다.

피타고리안 승률의 개념과 역사

피타고리안 승률(Pythagorean Expectation)은 야구 구단이 낸 득점과 실점을 대입하여 예상 승률을 계산하는 공식입니다. 이 개념은 세이버메트릭스의 선구자적 인물인 빌 제임스(Bill James)가 고안했으며, 피타고라스 정리와 공식이 유사하여 이러한 이름이 붙었습니다.

빌 제임스

빌 제임스는 1980년대 야구의 통계적 분석을 혁신한 인물로, 그의 연구는 전통적인 야구 통계를 넘어서 더 깊은 분석을 가능하게 했습니다. 그는 득점과 실점의 비율이 팀의 승률과 밀접한 관계가 있다는 사실을 발견했고, 이를 수학적 공식으로 정립했습니다.

 

피타고리안 승률은 단순히 승패 기록만으로는 알 수 없는 팀의 '진정한 실력'을 평가하는 도구로 자리잡았습니다. 야구는 운이 많이 작용하는 스포츠이고, 짧은 시간 동안의 성적은 운에 크게 좌우될 수 있습니다. 하지만 득점과 실점은 보다 큰 표본에서 나온 결과이므로, 이를 기반으로 한 피타고리안 승률은 팀의 실제 경쟁력을 더 정확하게 반영한다는 것이 기본 전제입니다.

 

더 나아가, 피타고리안 승률과 실제 승률의 차이는 팀의 '운'을 수치화하는 데 사용됩니다. 실제 승률이 피타고리안 승률보다 높다면 '운이 좋았다'고 볼 수 있고, 반대라면 '운이 나빴다'고 해석할 수 있습니다. 이러한 차이는 다음 시즌의 성적을 예측하는 데도 유용한 지표가 됩니다.

 

현재 MLB, KBO, NPB 등 세계 여러 프로야구 리그에서 팀 분석과 평가에 피타고리안 승률을 활용하고 있으며, 특히 시즌 중반이나 후반에 팀의 향후 성적을 예측하는 중요한 지표로 활용되고 있습니다.

피타고리안 승률 공식과 원리

피타고리안 승률을 계산하는 기본 공식은 다음과 같습니다.

 

변수 설명

W 팀의 득점
L 팀의 실점
n 지수 (일반적으로 2)
P 피타고리안 승률

 

일반적으로 n=2를 사용하지만, 예측의 정확성을 높이기 위해 다른 값을 사용하기도 합니다.

예를 들어, 베이스볼 레퍼런스에서는 1.83을 대입합니다. 그러나 실제 차이는 미미한 편입니다.

 

이 공식의 작동 원리는 간단합니다.

팀이 득점을 많이 할수록, 그리고 실점을 적게 할수록 승률이 높아집니다.

득점과 실점의 비율이 승패에 직접적인 영향을 미친다는 논리적인 가정에 기반하고 있습니다.

 

예를 들어, 득점과 실점이 같은 팀(득실차 0)의 피타고리안 승률은 정확히 0.500(5할)이 됩니다. 득점이 실점의 2배라면 승률은 약 0.800(8할)에 이르고, 득점이 실점의 4/3배(1.33배)라면 승률은 약 0.640이 됩니다.

 

피타고리안 승률은 철저하게 득점과 실점에 근거하기 때문에, 점수 차의 경향성과 비례합니다. 예를 들어,

  • 큰 점수 차이로 이기는 경기와 작은 점수 차이로 지는 경기가 많은 팀은 실제 승률보다 피타고리안 승률이 높을 수 있습니다.
  • 반대로, 접전에서 많이 이기고 크게 지는 경기가 많은 팀은 실제 승률이 피타고리안 승률보다 높을 수 있습니다.

이 공식의 장점은 단순함에도 불구하고 예측력이 상당히 높다는 것입니다. 많은 연구에서 피타고리안 승률은 시즌 중간에 측정했을 때 시즌 후반부의 팀 성적을 단순 승률보다 더 정확하게 예측하는 것으로 나타났습니다.

 

💡 TIP: 피타고리안 승률 해석하기

피타고리안 승률을 해석할 때는 다음 기준을 참고하면 됩니다.

  1. 실제 승률이 피타고리안 승률보다 3% 이상 높다면: 운이 매우 좋았거나 접전에서 강한 팀
  2. 실제 승률이 피타고리안 승률보다 3% 이상 낮다면: 운이 나빴거나 접전에서 약한 팀
  3. 차이가 ±3% 이내라면: 기대치에 부합하는 정상적인 성적

이러한 차이는 다음 시즌에 '평균으로의 회귀' 현상으로 정상화되는 경향이 있습니다.

 

승률 예측의 정확성과 한계

피타고리안 승률은 야구의 세이버메트릭스 공식들 중에서 가장 완성도와 신뢰성이 높고, 그 적중률도 높은 것으로 알려져 있습니다. 이는 야구가 득점을 많이 하면 이기고, 실점을 많이 하면 지는 스포츠라는 점에서 기인합니다. 하지만 모든 통계적 모델과 마찬가지로 피타고리안 승률에도 한계가 존재합니다.

피타고리안 승률의 정확성

야구에서 피타고리안 승률의 정확도는 상당히 높은 편입니다. 일반적으로 MLB의 경우 시즌 종료 후 피타고리안 승률과 실제 승률의 차이는 평균 3% 내외인 것으로 알려져 있습니다. 특히, 전체 시즌 경기 수가 많을수록(표본이 클수록) 정확도가 높아지는 경향이 있습니다.

 

KBO 리그를 분석한 연구에 따르면, 1982년부터 2022년까지 정규시즌 우승팀의 실제 승률이 피타고리안 승률보다 높은 경우가 10번, 낮은 경우는 3번이었습니다. 이것은 실력뿐만 아니라 운과 같은 요소도 우승에 영향을 미친다는 것을 보여줍니다.

예측력의 한계

그러나 피타고리안 승률에는 몇 가지 중요한 한계가 있습니다.

  1. 접전 경기 성적 반영 불가: 1점 차 경기에서의 승패는 팀의 '클러치' 능력이나 불펜의 활용 같은 요소에 영향을 받지만, 피타고리안 승률은 이러한 미묘한 차이를 반영하지 못합니다.
  2. 맥락 무시: 모든 득점과 실점을 동등하게 취급하여 경기 상황(선발 투수의 차이, 홈/원정 게임, 중요한 경기와 그렇지 않은 경기)을 구분하지 않습니다.
  3. 시즌 내 변화 반영 제한: 트레이드, 부상, 선수 컨디션 변화 등으로 인한 팀 실력의 변동을 실시간으로 반영하지 못합니다.

한 가지 흥미로운 점은 실제 승률이 피타고리안 승률보다 일관되게 높거나 낮은 감독들이 있다는 것입니다. 이는 감독의 전술 스타일이나 불펜 운용 방식이 승률에 체계적인 영향을 미칠 수 있음을 시사합니다. 그러나 이러한 패턴도 장기적으로는 평균으로 회귀하는 경향이 있습니다.

미래 예측도구로서의 적절성

피타고리안 승률은 '그동안 운이 좋았다/나빴다'는 후행지표로는 유용하지만, '앞으로 운이 좋을 것이다/나쁠 것이다'라고 단정하기는 어렵습니다. 다만, 통계적으로 봤을 때 피타고리안 승률과 실제 승률의 큰 불일치는 다음 시즌에 그 차이가 줄어드는 경향이 있습니다.

한화의 근래 마지막 가을야구 2018. 압도적인 불펜의 힘으로 피타고리안 승률을 역행했다..

예를 들어, 2018년 한화가 피타고리안 승률 0.500, 실제 승률 0.580 정도로 전반기를 마쳤다면, 후반기에는 실제 승률이 피타고리안 승률에 가까워지는 확률이 높습니다. 이러한 '평균으로의 회귀' 현상은 세이버메트릭스의 핵심 원리 중 하나입니다.

 

💡 TIP: 인접 시즌 성적 예측하기

다음 시즌 팀 성적을 예측할 때 참고할 수 있는 접근법:

  1. 이번 시즌 피타고리안 승률에 더 큰 가중치를 둡니다(약 70%)
  2. 실제 승률에는 낮은 가중치를 둡니다(약 30%)
  3. 주요 선수 변동(FA 이적, 트레이드, 은퇴)을 고려하여 조정합니다
  4. 핵심 선수의 나이와 부상 이력을 반영합니다

예: 피타고리안 승률이 0.550이고 실제 승률이 0.600인 팀의 다음 시즌 예상 기본 승률은 (0.550×0.7 + 0.600×0.3) = 0.565 정도로 예측할 수 있습니다.

 

 

다음 블로그에서는 실제 사례와 피타고리안 승률 불일치에 원인에 대한 이야기를 좀 더 심층적으로 해보겠습니다.

 

감사합니다.

 

Designed by JB FACTORY