Por dentro do renascimento dos dados no futebol
Humanos e tecnologia

Por dentro do renascimento dos dados no futebol

Como a posse de bola e a IA estão transformando táticas, recrutamento e decisões no futebol profissional

Imagine sintonizar para assistir ao pontapé inicial de uma partida da Copa do Mundo e ver um jogador mandar intencionalmente a bola até o outro lado do campo, para fora, na linha de fundo do adversário. Torcedores casuais talvez franzissem a testa. Qual é a lógica de entregar a posse de bola segundos depois do início do jogo? Se você fosse Jesse Davis, porém, saberia que essa jogada poderia ser uma preparação perfeita para marcar um gol.

Mini Banner - Assine a MIT Technology Review

Davis é professor de ciência da computação na KU Leuven, na Bélgica, e chefe de seu Laboratório de Análise Esportiva, que está na vanguarda do uso de dados no futebol desde sua criação, há mais de uma década. Embora o grupo de pesquisa aplique modelos de aprendizado de máquina a uma variedade de esportes, incluindo basquete, vôlei e hóquei sobre grama, em nenhum lugar seu impacto é mais sentido do que no campo de futebol.

Eles empregam análise avançada de dados para revelar uma série de descobertas, com o perdão do trocadilho, capazes de mudar o jogo, que estão transformando a tomada de decisão dos clubes profissionais. “O laboratório dele é o laboratório de análise esportiva mais influente no futebol”, diz Hugo Rios-Neto, líder de recrutamento por dados do Royal Sporting Club Anderlecht, na Bélgica. Eles ajudaram equipes a avaliar melhor seus elencos, conceberam formas de avaliar quão eficientes, ou não, são as estratégias e desenvolveram algoritmos que revelam padrões táticos ocultos.

Um deles, por exemplo, é o valor de chutar a bola para fora perto do gol e deixar que o adversário a coloque de volta em jogo com uma cobrança lateral, uma jogada que vem aparecendo em algumas das principais ligas do mundo nos últimos anos.

Para construir o argumento estatístico a favor desse movimento aparentemente contraproducente, o grupo de Davis criou um conjunto de dados de treinamento composto por mais de 1,4 milhão de passes e cerca de 60 mil cobranças laterais, em parte da Copa do Mundo de 2022. Eles usaram modelos de conjuntos de árvores, essencialmente uma combinação de árvores de decisão, para simular a tática. A conclusão, que os pesquisadores apresentaram em um artigo de 2024 com o título apropriado “Chute para longe”: quando a bola está no terço médio do campo, chutá-la para fora no lado do campo do adversário pode colocar sua equipe a até dez ações, como passes e dribles, de um gol. Isso pode ser muito relevante em um jogo que tem 1.500 ou mais ações por partida e pouquíssimos gols. A ideia, explica Davis, é que você se coloca em posição de recuperar a bola em uma situação vantajosa.

Além de fornecer insights pontuais para os dias de jogo, Davis também ocupa um nicho único no mundo da análise esportiva, no qual muitos clubes agora contratam suas próprias equipes internas de dados para manter uma vantagem competitiva. Ele disponibiliza gratuitamente a maior parte de sua pesquisa por meio de ferramentas de análise de código aberto, mas a vida acadêmica também lhe dá a liberdade de enfrentar problemas mais complexos, como a padronização de dados de jogo, um projeto que tornará mais fácil analisar imagens de partidas e elaborar estratégias vencedoras.

Com 45 anos, o pesquisador cresceu em Wisconsin, nos Estados Unidos, e passou a infância fascinado por basquete e futebol americano. O futebol era, em grande medida, algo inexistente para ele até a faculdade, quando o Brasil ganhou a Copa do Mundo de 2002 de forma célebre. Foi assim que o esporte o conquistou. Mas a ideia de um dia dissecá-lo nunca lhe passou pela cabeça. Seus estudos de doutorado em ciência da computação na Universidade de Wisconsin-Madison, nos Estados Unidos, o levaram a trabalhar com radiologistas na análise de laudos de mamografia.

Em outubro de 2010, ele ingressou na KU Leuven como professor de ciência da computação, investigando a interseção entre Inteligência Artificial e saúde, com foco no monitoramento do desempenho atlético. Sua equipe de pesquisa estudava, por exemplo, a combinação de dados como frequência cardíaca com outras métricas para determinar se alguém estava treinando em excesso. Eles também se aprofundaram na biomecânica da corrida.

Os aspectos táticos e técnicos dos esportes, e do futebol em particular, tornaram-se objeto do trabalho acadêmico de Davis quando ele contratou Jan Van Haaren, um estudante de engenharia focado em IA e autodeclarado fanático por futebol. Ele se perguntava se a análise de dados poderia ser usada para estudar elementos como passes, finalizações e progressão da bola, métricas que o jogo apenas começava a processar digitalmente na época.

Não é preciso ser profundo conhecedor dessa tendência de uma gestão orientada por dados dos esportes profissionais para perceber que é relativamente fácil aplicar um trabalho estatístico aprofundado ao beisebol ou ao basquete. É possível isolar ações como arremessos em suspensão e atribuir valor àqueles feitos de perto ou de longe. Logo, um técnico percebe que um jogador que não consegue converter uma bandeja, mas arremessa da linha de três pontos com aproveitamento mais ou menos igual ao daqueles de média distância, pode muito bem optar pelo arremesso que vale mais pontos.

O futebol, em comparação, parecia um candidato pouco promissor para esse tipo de análise. “A imensa maioria das ações realmente não leva ao resultado de um gol nem sequer a uma finalização”, diz Rios-Neto. “Então é difícil elaborar ou extrair dos dados uma estratégia vencedora.”

Mas o amor de Van Haaren pela modalidade, e o amor de Davis pelos esportes em geral, os inspiraram a tentar. Com o tempo, Davis percebeu que o aprendizado de máquina e outras ferramentas de Inteligência Artificial se adequavam bem à complexidade, à fluidez e à velocidade do futebol. Em 2014, ele criou oficialmente o Laboratório de Análise Esportiva.

Com um grupo de cerca de dez estudantes e pós-doutorandos a qualquer momento, o laboratório começou a lançar o que Van Haaren chama de “fundamentos intelectuais de como o jogo é analisado hoje”. Os pesquisadores destrincharam ações dentro de campo e, de repente, passaram a atribuir valor à posse de bola, à estratégia em cobranças de pênalti, mire no centro, e aos méritos dos chutes de longa distância ao gol, arrisque-os. “Uma das tendências do futebol nos últimos cinco a dez anos é que o número de chutes de longa distância aumentou drasticamente”, diz Davis. “O que os dados permitem fazer é realmente quantificar quais são as probabilidades dessas coisas.”

Nos anos desde que Davis e sua equipe começaram a destrinchar táticas individuais do futebol, suas ideias começaram a permear clubes por toda a Europa, como o Club Brugge KV, da Bélgica, bem como organizações nacionais de futebol do país e dos Estados Unidos. “O trabalho que sai do laboratório é genuinamente útil”, diz Rios-Neto, “e os clubes o aplicam para uma série de finalidades.”

Van Haaren, que agora é diretor de inteligência de futebol no Club Brugge, é um dos muitos analistas internos que adaptam o trabalho do laboratório ao jogo profissional. “Nossa colaboração com o laboratório está centrada em traduzir a filosofia de futebol [da equipe] em resultados mensuráveis, orientados por dados”, conta. Quando um clube quer avaliar, por exemplo, quão bem um zagueiro está fazendo a bola avançar pelo campo, busca contabilizar quantas vezes a bola terminou na parte do gramado mais próxima do gol da equipe adversária. Isso é feito combinando dados de eventos, que registram ações com a bola, com dados de rastreamento, que registram a movimentação dos jogadores. Isso mostra quão bem os jogadores cumprem suas funções, algo útil no desenvolvimento e também na observação de novos recrutas.

O laboratório de Davis, enquanto isso, continua a fazer perguntas que se aplicam ao jogo em sentido amplo. Para determinar se há vantagem em tentar mais chutes de longa distância, por exemplo, a pós-doutoranda Maaike Van Roy e colegas modelaram o comportamento das equipes da Premier League inglesa usando um processo decisório de Markov, uma estrutura computacional na qual algumas ações estão sob o controle de uma pessoa, enquanto outras são aleatórias. Essa dualidade é particularmente útil para o futebol, em que o movimento pode parecer tudo menos linear. Os resultados, apresentados em 2021 na Conferência MIT Sloan de Análise Esportiva, mostraram que o Chelsea poderia ganhar 1,6 gol a mais por temporada ao chutar de longe com 20% mais frequência.

Apesar desses tipos de insights do laboratório de Davis e de grupos de pesquisa semelhantes que surgiram na última década em instituições como MIT e Carnegie Mellon, o futebol ainda fica um pouco atrás de muitos outros esportes profissionais quando se trata de coletar os dados de que os analistas precisam. Todas as equipes empregam pessoas para assistir a vídeos e usar softwares para anotar táticas específicas dentro de jogo, cujos detalhes talvez façam sentido apenas para os torcedores mais dedicados. É um processo em grande parte manual, que pode levar até seis horas por partida. “É um pesadelo completo para um analista de dados trabalhar com isso”, avalia Davis.

Assim, enquanto o laboratório segue em campo, Davis também se juntou a pesquisadores de outras instituições em um esforço para padronizar dados em todas as partidas. O grupo está experimentando transformers, a arquitetura de rede neural que sustenta grandes modelos de linguagem como o ChatGPT. Se for possível levar isso ao mundo do futebol, um anotador humano de jogo poderia marcar uma tática, digamos, um contra-ataque em três contra dois, algumas vezes, e isso poderia treinar o modelo no conceito para que ele marcasse instâncias subsequentes por conta própria. “Houve muito progresso”, diz Davis. “Mas isso ainda continua bastante difícil.”

Mas, se estamos contando o placar, o trabalho do laboratório já tornou o processo de análise mais fácil graças às ferramentas de código aberto que disponibilizou, algumas das quais registram milhares de downloads por mês. Uma delas é um framework chamado VAEP, um modelo que avalia os efeitos de todas as ações com a bola. Outra é um modelo de xG, gols esperados, que analisa a qualidade de uma chance de gol. Há ainda um pacote para sincronizar dados de eventos com dados de rastreamento. “Muitas pessoas na indústria usam nosso código em seus fluxos de trabalho diários”, explica.

Para ele, a aplicação prática de ter seu código disponível é importante, mas a verdadeira, digamos, emoção é ver a teoria se tornar prática. Como o pesquisador diz, “sou realmente motivado a resolver problemas que surgem em contextos reais e a ver meu trabalho ter impacto.”

Último vídeo

Nossos tópicos