El béisbol de las Grandes Ligas: del dato a la analítica

El béisbol es un deporte con una larga y rica historia en la recopilación de datos relacionados con el desempeño de los equipos, así como de los jugadores que han competido en esta disciplina profesionalmente por más de 100 años. Es más, el béisbol de Grandes Ligas (MLB, por sus siglas en inglés), a nivel mundial, debe ser el deporte profesional con la base de datos más extensa en lo concerniente a las métricas estadísticas que se utilizan y recopilan en sus partidos.

Por ejemplo, el sitio web Baseball Reference tiene disponibles datos estadísticos de jugadores y equipos que han competido en ese deporte desde la temporada del año 1871. El primer juego de esa temporada se celebró el 4 de mayo entre los equipos Cleveland Forest Citys y Fort Wayne Kekiongas. Sin embargo, como ese partido se celebró bajo la llamada National Association todavía está en disputa si esos dos equipos y la liga en sí pueden ser considerados como las Grandes Ligas.

Ahora bien, la Liga Nacional (considerada como las Grandes Ligas) celebró su primera temporada oficial en el año 1876. El campeón fue el equipo Chicago White Stockings con récord de 52 victorias y 14 derrotas; anotó 624 carreras y permitió 257 carreras. Al Spalding, el dueño del equipo y empresario de artículos deportivos para el juego, compitió como dirigente y lanzador. Logró 47 victorias y 12 derrotas durante esa temporada.

No obstante, 30 años antes, en el 1846 (un año después de haber sido fundado el equipo Knickerbocker Baseball Club en la ciudad de Nueva York), se celebró el primer partido oficial de béisbol contra un equipo de jugadores de cricket. Uno de sus jugadores, Alexander Joy Cartwright, estableció varias de las reglas que todavía configuran el fundamento del juego. Por ejemplo, la forma de diamante del campo interior (“infield”), las líneas del “foul” y la regla del “out” con tres “strikes”. En otras palabras, el béisbol, como un deporte organizado, lleva tres siglos de competencia y recopilación de datos referentes a los equipos y el desempeño de sus jugadores.

El uso de cálculos estadísticos como medidas del desempeño en los partidos del béisbol ha sido parte esencial del juego desde sus primeros pasos como deporte organizado. El periodista deportivo de cricket del diario The New York Times, Henry Chadwick, es conocido como el “padre del béisbol” pues, a mediados de los años 1850, utilizó su amplio conocimiento en el juego inglés para desarrollar las primeras medidas estadísticas del béisbol. Además, se le atribuye la primera edición de la guía del béisbol que se vendió al público general. También, publicó el primer “box score” de un juego de béisbol en el 1859 (basado en el “scorecard” del cricket) y creó la abreviatura “K” para designar un ponche. Además, las estadísticas de promedio ofensivo de bateo (AVG) y el promedio de carreras permitidas de un lanzador por nueve entradas (ERA).

El legendario Branch Rickey revolucionó la organización de los equipos y de las Grandes Ligas en la década del 1930 al establecer el sistema de equipos finca para los Cardinals de San Luis. Más tarde en el 1947, como gerente general del equipo Brooklyn Dodgers, firmó al primer jugador negro en el MLB, Jackie Robinson y, en ese mismo año, contrató a Allan Roth como analista estadístico del equipo. Roth comenzó a contabilizar cada lanzamiento que se realizaba en los juegos y convenció a Rickey de que el uso de las estadísticas situacionales (equipo local/visitante; lanzador derecho/zurdo; juego día/noche, entre otras), podía ayudar a ganar los juegos. El uso de estrategias basadas en ese tipo de análisis puntual llevó el juego de béisbol a otro nivel analítico. Otra aportación de estos dos actores a las estadísticas del béisbol se coaguló en el 1984 cuando la métrica “on-base percentage (OBP)” se convirtió en una estadística oficial del MLB. La misma había sido desarrollada por Rickey y Roth en la década del 1950 para medir el por ciento de veces que un jugador alcanza cualquier base por apariciones al bate.

Por otro lado, durante los años de la década de 1950, Pete Palmer, en su tiempo libre, emprendió la recopilación de datos de diferentes fuentes y desarrolló la primera base de datos del béisbol. La misma consistía en el desempeño por temporada y el total acumulado de los peloteros que habían participado en el MLB. Fue uno de los primeros en profundizar en el análisis situacional al demostrar que el contexto en el que se da el desempeño de cada jugador era crucial para comprender su verdadero impacto en términos de ganar o perder un juego. En el 1978 Palmer, junto a Dick Cramer, inventó la métrica “on-base plus slugging (OPS)” que es aceptada como la medida universal de bateo. La misma mide la habilidad del bateador de llegar a base y batear con poder.

En agosto el 1971 se reúnen, en el Salón de la Fama del Béisbol, 16 investigadores de los datos del juego y forman la “Society for American Baseball Research (SABR)”. El término “sabermetric” se refiere al análisis empírico de las estadísticas del béisbol y fue acuñado por el estudioso del juego Bill James. El término se deriva del acrónimo SABR y las métricas del deporte. James en el 1980 definió “sabermetrics” como “la búsqueda del conocimiento objetivo del béisbol”.

El uso de modelos estadísticos y econométricos para el análisis del desempeño de los peloteros y los equipos ha crecido exponencialmente desde inicios de este siglo. La presencia de un equipo de analistas de datos en las oficinas gerenciales de los equipos de MLB, compuesto por matemáticos, estadísticos, científicos de computadoras y economistas es parte esencial de sus operaciones. Por eso, los procesos de negociación de contrato entre equipos del MLB y los peloteros son aquilatados a través de modelos matemáticos sofisticados basados en la analítica de datos.

Desde la publicación en el 2003 del famoso libro “Moneyball” escrito por Michael Lewis, del que se han vendido más de un millón de copias, la publicación de textos que tratan la dimensión cuantitativa del juego es abrumadora. Lewis expone el uso creativo del análisis estadístico por parte del equipo Oakland Athletics en un mercado ineficiente. En MLB, al inicio de este siglo, los equipos fallaban en utilizar efectivamente la información disponible del juego, con la cual se podía prevalecer ante la inequidad económica que facilitaba a los equipos poderosos adquirir los jugadores estelares.

Ahora, además del “sabermetric”, en el béisbol también se habla del “baseball analytics”, lo que se entiende como el uso de métodos estadísticos sofisticados para evaluar el desempeño de los jugadores y las estrategias en los juegos. Sin embargo, la analítica no se queda ahí y añade la dimensión de la inteligencia de negocios en la toma de decisiones. En los últimos años, la analítica ha incorporado el análisis de videos con modelos digitales que describen y desentrañan la física que está detrás de las jugadas que ocurren en los partidos.

Está claro que el análisis estadístico del juego ha estado presente desde sus inicios y es parte esencial de las estrategias que se llevan a cabo en el mismo, tanto en el terreno de juego como fuera de este. Lo que ha evolucionado es el nivel de sofisticación que ha alcanzado. Leo Durocher lo explicó de una forma sinigual: “baseball is like church. Many attend, few understand”.

El profesor Nicolás Ramos Gandía es Catedrático Asociado de Matemáticas de la Universidad Interamericana de Puerto Rico en el Recinto de Arecibo. Actualmente, junto a otros dos colegas y un estudiante de ciencias de computadora, trabaja en dos proyectos de la universidad relacionados con la analítica de datos aplicada a la academia.