A convergência entre pesquisa operacional e ciência de dados nos processos decisórios
Inteligência artificial

A convergência entre pesquisa operacional e ciência de dados nos processos decisórios

Origens da pesquisa operacional

A história da pesquisa operacional se inicia em dias desesperadores durante a Segunda Guerra Mundial. Experimentando o caos, e prevendo uma derrota iminente, os líderes militares recorreram não somente aos soldados, mas também às mentes brilhantes dos cientistas da época. Esses cientistas, um grupo heterogêneo formado com físicos, matemáticos e engenheiros, receberam uma tarefa radical: aplicar lógica e dados a várias operações de guerra. Eles foram os primeiros pesquisadores operacionais.

Mini Banner - Assine a MIT Technology Review

O termo pesquisa operacional foi utilizado inicialmente em 1940, quando esses cientistas britânicos empregaram durante a guerra métodos para alocação de recursos escassos, melhorias na utilização de radares, otimização de rotas e táticas de guerra submarina.

Dentre várias tarefas, eles analisaram dados de navegação e desafiaram tradições navais de longa data. Suas conclusões baseadas nos dados, inicialmente contraintuitivas, salvariam milhares de vidas e os ajudariam, eventualmente, a ganhar a guerra. Uma das ideias era de que grandes comboios com mais escoltas seriam uma escolha bem mais segura do que pequenos comboios com poucas escoltas.

Com o fim da guerra, esses pioneiros na pesquisa operacional prosseguiram com seus estudos. As ferramentas analíticas que haviam vencido os submarinos, seriam, agora, usadas para otimizar processos em indústrias, transformando uma necessidade de guerra em uma disciplina relevante na busca de soluções para problemas complexos. As indústrias britânicas de carvão, eletricidade e transporte foram as primeiras a adotar a pesquisa operacional como forma de buscar soluções eficientes para problemas de negócio.

Além da indústria, esses métodos foram rapidamente absorvidos na academia. O Massachusetts Institute of Technology (MIT) criou o primeiro programa de pesquisa operacional por volta de 1948, liderando formalmente o reconhecimento dessa disciplina.

Princípios da pesquisa operacional e da ciência de dados

A proliferação massiva dos dados ao longo dos anos criou a necessidade de novas técnicas escaláveis para se encontrar padrões de comportamento em enormes conjuntos de informações. Essa necessidade fomentou o desenvolvimento da ciência de dados como uma disciplina explicitamente projetada para endereçar esta nova realidade. Ainda que a pesquisa operacional e a ciência de dados possuam práticas comuns, como modelagem estatística, simulação e otimização, suas abordagens divergem significativamente.

A pesquisa operacional foca em uma metodologia analítica que alavanca a modelagem matemática para guiar as organizações em processos de tomada de decisão. Modelos de otimização consistem em processos estruturados que, sistematicamente, quebram problemas complexos em componentes mais simples. De maneira geral, esses componentes envolvem a formulação do problema, a observação do sistema, o modelamento matemático, a verificação do modelo, a seleção de alternativas, a apresentação de resultados e a avaliação das recomendações. Essa estrutura sistêmica na solução dos problemas diferencia significativamente os modelos de otimização das abordagens puramente baseadas em dados. Os modelos de pesquisa operacional seguem uma ordem fundamental: primeiro o modelo, depois os dados.

Os modelos de otimização iniciam com os passos de formulação do problema e de observação do sistema antes de modelar o problema matematicamente. É uma abordagem de cima pra baixo, focando na estrutura do problema a partir de um entendimento do sistema real. Só depois os dados são usados para popular o modelo, verificar as suposições e refinar a solução.

A otimização matemática é o pilar central da pesquisa operacional. Otimização é o processo de selecionar os melhores elementos em um conjunto de alternativas disponíveis, baseado em critérios específicos como, por exemplo, maximizar ou minimizar uma função-objetivo. A linguagem universal da otimização é construída com base em três componentes fundamentais que fornecem uma estrutura poderosa para traduzir, virtualmente, qualquer problema de negócio em uma equação matemática. Esses três componentes são os seguintes: as variáveis de decisão, que são quantidades físicas ou decisões sob o controle do decisor; a função-objetivo, que é a expressão matemática que representa o objetivo de negócio que o modelo vai tentar otimizar; e as restrições, que representam os conjuntos de igualdades ou desigualdades que limitam as variáveis de decisão no mundo real.

Em um problema de logística, por exemplo, a variável de decisão pode ser o número de caminhões associados à distribuição de produtos em uma rota específica. A função-objetivo pode ser minimizar o tempo total de entrega, ou seja, determinar as rotas que irão permitir a distribuição de forma mais rápida. As restrições podem estar relacionadas com o orçamento existente, a quantidade de caminhões, as capacidades dos diferentes caminhões, as janelas de entregas disponíveis, os custos de transporte, dentre outras limitações no mundo real. Mesmo um problema extremamente complexo pode ser quebrado nesses três componentes, criando uma abordagem factível na busca de uma solução ótima.

No caso da ciência de dados, essa ordem fundamental (modelo primeiro, dados depois) é quase que oposta, sobretudo nas abordagens que envolvem modelos de aprendizado de máquina. Esses modelos iniciam com os dados brutos, e fazem uso de algoritmos para encontrar padrões sem uma estrutura matemática predefinida. Na verdade, essa estrutura matemática vai ser definida posteriormente, de acordo com as características dos dados. Mesmo que os algoritmos de aprendizado de máquina utilizados na solução de problemas possam ser completamente diferentes, como redes neurais, máquinas de vetores de suporte ou modelos baseados em conjunto de árvores de decisão, o processo de definição do modelo propriamente dito vem depois da análise dos dados. Ou seja, na ciência de dados, a ordem é: primeiro os dados, e depois os modelos. Essa distinção é essencial para se compreender como essas duas disciplinas irão se complementar.

Sinergia entre a pesquisa operacional e a ciência de dados

Ainda que a pesquisa operacional e a ciência de dados sejam disciplinas distintas, ambas influenciam os processos mais modernos de tomada de decisão. Contudo, o verdadeiro poder delas nos processos de decisão se vê quando existe uma sinergia entre elas. A pesquisa operacional é uma disciplina madura, fortemente estabelecida e fundamentalmente prescritiva. Seu objetivo principal é determinar o curso ótimo de uma ação ao responder perguntas como “o que deve ser feito?”. A ciência de dados, ao contrário, é uma disciplina mais recente, focada em soluções baseadas em dados e fortemente preditiva. Ela busca descobrir padrões de comportamento nos dados e estimar resultados futuros, endereçando questões como “o que vai acontecer?”, ou, pelo menos, com a intenção de saber a probabilidade de acontecer. A ciência de dados fornece como resultado as probabilidades ou os valores estimados, como prognósticos de demandas ou vendas, chances de os clientes comprarem um produto, abandonarem a empresa, ou executarem fraude.

Do ponto de vista da sinergia, os benefícios vêm da capacidade preditiva de um e da prescritiva de outro. Por exemplo, os modelos preditivos podem estimar quantidades de viagens, valores de vendas ou número de clientes. Essas estimativas podem, por sua vez, potencializar modelos de otimização, permitindo-os gerar soluções ótimas e resultados acionáveis como rotas eficientes de distribuição, estratégias de preços mais rentáveis e planejamento de força de trabalho.

Um exemplo bastante ilustrativo é o problema do “caminho mais curto”, popularizado em aplicações de navegação como o Google Maps. O papel da ciência de dados nesse contexto seria analisar, em tempo real, as informações massivas e dinâmicas de tráfego, prevendo o tempo de viagem para cada segmento de rota possível. Esses diferentes tempos de tráfego estimados alimentariam então os parâmetros do modelo de otimização, o qual prescreveria a rota ótima, nesse caso, o trajeto mais rápido, considerando, contudo, a situação corrente do tráfego. Isso demonstra uma clara relação de causa e efeito onde a saída predita pelos modelos de ciência de dados potencializa as soluções prescritas pelos modelos de pesquisa operacional. Um modelo dinâmico onde a prescrição depende da predição.

Convergência entre a pesquisa operacional e a ciência de dados

A convergência entre pesquisa operacional e ciência de dados, alimentada, sobretudo, pela Inteligência Artificial e pelo aprendizado de máquina, direciona a criação de novos paradigmas como o Aprendizado de Máquina Aumentado por Otimização Combinatória (COAML, da sigla em inglês). Esse novo campo de estudo combina métodos de aprendizado de máquina e pesquisa operacional para solucionar problemas dentro de um contexto específico, normalmente considerando incertezas e análises combinatórias. COAML envolve tipicamente a adição de camadas de análise combinatória durante o treinamento de redes neurais profundas, normalmente com técnicas de aprendizado baseadas em decisão. O tema ganhou destaque em 2022 durante uma competição envolvendo modelos de otimização de rotas para veículos (EURO Meets NeurIPS 2022 – Vehicle Routing Competition). Esse novo campo de estudo será fundamental no desenvolvimento de sistemas completamente autônomos e auto-otimizados, que prometem revolucionar setores como Logística, Saúde, Finanças e Marketing.

Um outro exemplo dessa convergência está relacionado com a criação de agentes de Inteligência Artificial, que são sistemas autônomos capazes de definir objetivos, planejar tarefas, executar ações e se adaptar a mudanças com base em feedbacks, sem a necessidade de um contínuo monitoramento humano. Em aplicações futuras, um agente inteligente utilizaria, no primeiro momento, análise preditiva para compreender ou prever uma determinada situação. Em seguida, uma análise prescritiva para executar um plano ótimo. Isso resultaria em um sistema de automelhoria contínuo, que uniria o poder preditivo do aprendizado de máquina com a capacidade prescritiva da pesquisa operacional.

Aplicações reais da combinação da pesquisa operacional com a ciência de dados

Os princípios da pesquisa operacional e da ciência de dados estão implementados em diversas indústrias para solucionar problemas complexos. Em Logística e Cadeia de Suprimentos, por exemplo, um fornecedor global de embalagens térmicas de alto valor encarava um desafio significativo: uma baixa taxa de retorno para os seus recipientes reutilizáveis, que custavam, por unidade, centenas de dólares para serem substituídos.

Uma conhecida empresa de logística utilizou o seu robusto sistema de gerenciamento de transporte em conjunto com uma plataforma de dados para criar uma solução customizada para esse cliente. Esse sistema rastreia cada embalagem utilizando um número de identificação único e envia alertas se um recipiente não é coletado para retorno em uma primeira tentativa. O time dessa empresa então intervém de forma proativa contatando o destinatário final e facilitando o retorno do produto. Essa forma simples de otimização direcionada por dados dinâmicos dentro de um processo de logística teve um impacto relevante nos resultados alcançados, minimizando os custos de substituição dos recipientes não retornados e reduzindo o tempo de reposição.

Outro exemplo prático é na alocação da força de trabalho. Uma grande empresa de logística utiliza análise e otimização para planejar a quantidade de funcionários de forma dinâmica, proporcionando uma economia substancial em custos trabalhistas. Analisando os dados dos empregados, essa empresa conseguiu um aumento médio de produtividade em cerca de 18%, além de reduzir o tempo não produtivo em 42% por meio de mentorias direcionadas, ativando os talentos subutilizados. A análise também revelou que, em determinadas funções, funcionários trabalhando remotamente eram mais produtivos, o que permitiria à empresa tanto expandir sua força de trabalho quanto reduzir os custos com escritórios físicos. Este exemplo demonstra uma tendência mais ampla na transformação digital, onde eficiências operacionais estão altamente ligadas à aplicação de modelos analíticos nos recursos humanos.

Mais um caso vem da área de marketing e experiência do cliente, onde os princípios da pesquisa operacional e da ciência de dados podem ser aplicados ao marketing digital. A otimização da taxa de conversão (CRO, sigla em inglês) é um processo sistemático de aumentar o percentual de visitantes de um website que tomam uma ação desejada, como a compra de um produto ou a subscrição de um serviço. A ideia principal envolve analisar o comportamento dos usuários de forma a promover melhorias ou mudanças no design do website, seja de conteúdo ou simples diagramação. Empresas utilizam testes A/B como uma forma controlada de avaliar diferentes ações e suas consequências. Por exemplo: uma empresa pode ter como objetivo otimizar os elementos de um website (variáveis de decisão) de forma a maximizar uma ação específica, como compra ou subscrição (função objetivo), dado um conjunto de demandas ou disponibilidades existentes (restrições). Técnicas avançadas de análise causal, envolvendo combinação de algoritmos de redes neurais profundas e modelos de otimização, aumentam ainda mais a compreensão das soluções ótimas propostas para os websites, com uma análise de causa e efeito mais refinada. Alguns casos de sucesso: uma empresa de viagens aumentou seu lucro em milhões de dólares simplesmente por remover alguns campos do formulário de compra; e uma empresa de previsão do tempo alcançou 225% de aumento de conversão simplesmente reorganizando sua homepage. Recentemente, um banco brasileiro aumentou a receita em milhões de reais simplesmente alterando, no aplicativo, a posição do botão “parcelar fatura”. Soluções ótimas de hiperpersonalização podem ser alcançadas com a convergência entre a ciência de dados, por meio da identificação de padrões, e a pesquisa operacional, por meio da otimização de diferentes cenários.

Conclusão e visão futura

A convergência entre a pesquisa operacional e a ciência de dados vai muito além da simples colaboração. Novos paradigmas, como o aprendizado de máquina aumentado por otimização combinatória, os modelos de inferência causal baseados em aprendizado profundo e otimização, e os assistentes inteligentes, estão criando sistemas autônomos integrados que podem aprender a partir dos dados e prescrever ações ótimas dentro de um processo contínuo. O futuro das decisões baseadas em dados será uma vitória não de uma disciplina sobre a outra, mas da sinergia entre a ciência de dados, com seu poder preditivo, e a pesquisa operacional, com sua capacidade prescritiva. A ciência de dados fornece “o que” e até “porquê”, ao passo que a pesquisa operacional fornece o “como”. Essa sinergia permite que as organizações passem de um estágio onde exista um simples entendimento dos dados, para um onde seus sistemas sejam ativamente otimizados e adaptáveis.

Com processos de decisão cada vez mais automatizados, a questão que se levanta é a inclusão do ser humano nestes ciclos. Quando e como as pessoas deveriam se envolver no ciclo decisório e impactar no processo? Robôs inteligentes decidindo sobre empréstimos bancários ou análises de crédito sem a participação de um humano. Carros autônomos dirigindo sem a intervenção de motoristas. Onde ficam as responsabilidades e obrigações nesses casos? Como a ética nessas decisões vai ser considerada? A tecnologia avança de forma extremamente rápida, mas as questões éticas e de responsabilidades nem tanto.

Carlos Pinheiro trabalha no SAS Institute Inc, EUA, desde 2015, como Distinguished Data Scientist, e como Professor Adjunto na SKEMA Business School in Raleigh, NC, desde 2021. Trabalha na área de analytics desde 1996. Com formação em matemática e ciência da computação, possui mestrado em computação pela UFF e doutorado em engenharia pela COPPE/UFRJ. Realizou pós-doutorados no Brasil e no exterior, em sistemas dinâmicos no IMPA (2006-2007), em análise de redes sociais na Dublin City University, Irlanda (2008-2009), em sistemas de transporte na Université de Savoie, Franca (2012), em análise de redes dinâmicas na KU Leuven, Bélgica (2013-2014) e em mobilidade urbana na FGV (2014-2015). Possui diversos artigos publicados em jornais e conferências internacionais, detentor de uma patente nos EUA com um algoritmo para análise de redes georreferenciadas, e é autor dos livros Network Science: Analysis and Optimization Algorithms for Real-World Applications (Wiley, 2022), Introduction to Statistical and Machine Learning Methods for Data Science (SAS, 2021), Heuristics in Analytics: A Practical Perspective of What Influence Our Analytical World (Wiley, 2014) e Social Network Analysis in Telecommunications (Wiley, 2011).

Último vídeo

Nossos tópicos