O problema de Monty Hall: probabilidade condicional
Computação

O problema de Monty Hall: probabilidade condicional

O uso de modelagem estatística e matemática, considerando as teorias pertinentes a cada um dos problemas de negócio, permite que as organizações possam embasar suas decisões em fatos científicos, em probabilidades de ocorrência, e não em conjecturas aleatórias.

O que você encontrará neste artigo:

Métodos heurísticos
Teoria da probabilidade
Entendimento do problema

Banner indicando a posição do botão de download do artigo em formato pdf

Em dois artigos anteriormente publicado aqui na MIT Technology Review Brasil, tratei de questões impactantes em análise e Ciência de Dados. Não importa o quanto de Ciência utilizamos na modelagem estatística e matemática, existem fatores aleatórios que podem mudar o curso da história, mais precisamente, das decisões que se apoiam nos resultados desses modelos. A aleatoriedade dos eventos, em um processo estocástico, altera a forma como os modelos são construídos. Outro tema relevante abordado foram os métodos heurísticos na construção de modelos analíticos. Esses métodos visam a abreviar o tempo de consideração de todas as possibilidades na resolução de um problema em particular, considerando diferentes aspectos do cenário em estudo. Por vezes, os métodos heurísticos são baseados em indução ou analogia. Normalmente, ignoram parte da informação inicial do problema, com o objetivo de acelerar a busca por uma solução satisfatória, ainda que não a ótima, que talvez pudesse ser alcançada por processos complexos e exaustivos. Assim, a heurística pode ser considerada como sendo baseada em teorias incompletas, como, por exemplo, a teoria da probabilidade, bastante utilizada em processos estocásticos por fornecer abstrações matemáticas em processos dúbios ou não determinísticos.

A teoria da probabilidade pode ser considerada essencial em diversas atividades humanas que envolvem análise de dados. Métodos probabilísticos podem ser utilizados para descrever sistemas complexos, fornecendo conhecimento parcial dos seus estados, como, por exemplo, em mecânica quântica, em que os fenômenos físicos em escala atômica possuem uma natureza probabilística muito forte.

Dentro de um contexto de Ciência de Dados, a probabilidade exerce um papel fundamental em processos analíticos. Um caso típico para ilustrar essa importância, sobretudo no que diz respeito à análise de dados com implicações nos processos decisórios, é conhecido como o problema de Monty Hall. Esse exemplo mostra bem como uma boa fundamentação científica, no caso, em probabilidade condicional, pode fazer toda a diferença na tomada de decisões. Simplisticamente, a probabilidade condicional refere-se à probabilidade de um evento A ocorrer dado que um evento B já ocorreu.

Em um paralelo com o mundo corporativo, o problema de Monty Hall é um bom exemplo de como é importante estar ciente do problema, do cenário que o descreve e dos possíveis métodos de resolução, nesse caso, dos eventos de negócio, do mercado, dos clientes, dos competidores e de quaisquer outros fatores que possam influenciar na solução do problema. E, igualmente importante, ilustra como é crítico entender o cenário de modelagem para prever os eventos em estudo. Para aumentar as chances de sucesso, particularmente em uma perspectiva de negócios, é importante entender as equações que, pelo menos com precisão aproximada, descrevem o cenário sob investigação – mesmo que esse cenário seja composto por situações aleatórias. Assim, seria possível ao menos estimar um resultado esperado dado um cenário específico, seja ele probabilístico (com base em informações históricas de eventos passados) ou estocástico (como em uma sequência de eventos aleatórios). Por exemplo, ao se lançar uma moeda para cima e apostar em cara ou coroa, deve-se saber que as chances de acertar são de 50-50, não importa se a escolha foi cara ou coroa. Embora isso pareça bastante simples e direto, as organizações não fazem isso com muita frequência. Elas normalmente não se preparam para os próximos eventos de forma probabilística, como analisar eventos pregressos e confirmar as probabilidades possíveis.

Por exemplo, no caso da moeda, se a jogarmos para cima 1.000 vezes, muito provavelmente não iremos observar 500 caras e 500 coroas, talvez devido à constituição da moeda, ao material, como ela foi produzida (não completamente simétrica), à forma como a pessoa a joga para cima etc. Vários fatores podem produzir resultados diferentes do esperado. Por isso, a observação é tão importante na Ciência de Dados, sobretudo na modelagem probabilística.

O problema de Monty Hall é um caso que ilustra essa noção, de que o conhecimento sobre o cenário e as chances envolvidas fazem toda a diferença entre ganhar e perder.

Let’s Make a Deal é um game show de televisão originalmente produzido nos Estados Unidos e, posteriormente, popularizado em todo o mundo. Monty Hall foi um dos criadores e apresentou o programa por quase 30 anos. A premissa do show é fazer com que os jogadores aceitem ou rejeitem os acordos oferecidos a eles pelo apresentador. Os participantes geralmente precisam analisar e pesar todas as possibilidades atribuídas a uma determinada oferta descrita pelo anfitrião. Essa oferta pode ser um prêmio valioso ou um item totalmente inútil.

O problema de Monty Hall é, na verdade, um quebra-cabeça de probabilidades, considerado um paradoxo porque, embora o resultado pareça impossível, ou contraintuitivo, é estatisticamente observado como verdadeiro. Esse problema foi proposto pela primeira vez por Steve Selvin, em uma carta ao The American Statistician em 1975. Ele foi publicado novamente na PARADE Magazine em 9 de setembro de 1990, na coluna de domingo “Pergunte à Marilyn”, na página 16.

“Suponha que você esteja em um game show e tenha uma escolha entre três portas: atrás de uma porta, há um carro; atrás das outras duas, cabras. Você escolhe uma porta, digamos, a nº 1, e o anfitrião, que sabe o que está atrás das portas, abre outra porta, digamos, a nº 3, que tem uma cabra. Ele, então, diz: ‘Você quer escolher a porta nº 2?’. A questão é: seria vantajoso mudar sua escolha?”

Em sua resposta, Marilyn vos Savant disse que o competidor deve sempre mudar para a outra porta e, ao fazê-lo, ela explicou que o competidor dobraria suas chances. A resposta de Savant afirmava que, se o jogador mudasse de porta, sua probabilidade de acertar seria de 2/3, ao passo que, se ele permanecesse com a opção original, sua probabilidade seria de 1/3. Ela foi inundada com mais de 10.000 cartas de todo o país, incluindo cartas de 500 PhDs, matemáticos e estatísticos associados a universidades e instituições prestigiadas. A maioria das cartas dizia respeito ao erro de Savant, e algumas delas até pediam que ela admitisse seu erro em nome da Matemática. Intuitivamente, o conceito do jogo nos leva a acreditar que cada porta tem uma chance em três de ter o carro atrás dela, o que é verdade inicialmente, e o fato de uma das portas ter sido aberta muda a probabilidade das outras duas. Uma vez que uma porta é aberta, as chances de se ter um carro atrás de uma das duas portas restantes seriam de uma em duas para cada uma das portas. Quando uma porta é aberta, é como se tivéssemos mudado essencialmente o cenário original, de três portas para apenas duas. Mas, na realidade, não há como alterar as probabilidades de cada porta, antes ou depois de a primeira porta ter sido aberta. Todas as portas mantêm a chance de um em três de ter um carro atrás dela, tanto por ocasião da primeira pergunta (três portas fechadas) quanto por ocasião da segunda (duas portas fechadas e uma aberta).

Marilyn vos Savant afirmou que, se o carro tiver a mesma probabilidade de estar atrás de cada porta, um jogador que escolheu a porta número 1 e não trocou tem uma chance em três de ganhar o carro, enquanto um jogador que escolhe a porta número 1 e troca, tem uma chance de dois em três. Desta forma, os jogadores devem mudar a porta para dobrar suas chances.

Mini Banner - Assine a MIT Technology Review

O problema de Monty Hall exige algumas suposições. O primeiro é sobre justiça. O carro deve ter uma possibilidade igualmente provável de estar atrás de qualquer uma das três portas, e o competidor pode inicialmente escolher qualquer porta. Monty Hall sempre abrirá uma porta que não possui o carro, dando ao competidor a oportunidade de mudar sua escolha inicial de porta. Esse fato é extremamente importante. Monty Hall sabe o que está por trás de cada porta, e sempre abrirá uma porta que revela uma cabra. Se Monty Hall revelasse o carro, o jogo terminaria. Ao revelar a cabra atrás da porta, Monty Hall não altera as chances das portas restantes para 50-50. Na verdade, e desde o início, cada uma das outras duas portas não escolhidas tem uma chance de um em três, e, portanto, a soma da porta restante, não considerando a escolhida inicialmente pelo competidor, é de duas em três. O fato de Monty Hall abrir uma porta que ele sabe que tem uma cabra atrás coloca os dois terços das chances de ganhar na porta ainda não escolhida pelo competidor.

A forma reversa de entender esse problema é calculando-se a probabilidade de perder. Ao escolher uma porta, o jogador possui 1/3 de chances de ganhar (a porta escolhida), e 2/3 de perder (as outras duas portas). Mudar a porta faz o jogador perder apenas se ele tivesse escolhido a porta com o carro. Uma das portas é aberta, sabendo-se que tinha uma cabra. Assim, a probabilidade de errar trocando-se de porta é de 1/3, correspondente à probabilidade de acerto da porta inicialmente escolhida. Contudo, a probabilidade de errar dessa porta inicialmente escolhida permanece de 2/3. Dessa forma, trocar de porta reduziria pela metade as chances de o jogador errar, de 2/3 (porta inicialmente escolhida) para 1/3 (porta restante depois que uma das outras duas foi aberta).

Para finalizar, pense nos detalhes desse problema na forma de uma tabela que mostra todos os arranjos possíveis de um carro e duas cabras atrás de um total de três portas. Suponha que você escolha a porta nº 1. Na primeira linha da tabela, você pode ver que, se trocar, você perde, e se você ficar, você ganha. Na segunda linha, se você trocar, você ganha, e se ficar com sua escolha original, você perde. Finalmente, no terceiro arranjo, se você trocar, você ganha, e se ficar, você perde. Ao escolher a porta nº 1, se você mantiver a porta e ficar com essa escolha, você ganha uma vez. Mas, se você trocar, terá a chance de ganhar duas vezes. Cálculo análogo pode ser feito para as portas 2 e 3. Ao final, mudando a escolha inicial para a outra porta, você dobrará suas chances de ganhar.

Porta 1  Porta 2  Porta 3  Trocar  Ficar 
Carro  Cabra  Cabra  Cabra  Carro 
Cabra  Carro  Cabra  Carro  Cabra 
Cabra  Cabra  Carro  Carro  Cabra 

Apesar desse problema específico ser sobre jogos de azar, conhecendo-se a teoria adequada e entendendo-se a melhor forma de calcular e modelar determinado cenário, as organizações podem dobrar (ou ao menos aumentar) suas probabilidades de ganhar (não em jogos de azar, mas vantagem competitiva em cenários de negócio). Apesar da influência dos eventos aleatórios no mundo real, ao saber a maneira correta de descrever um determinado cenário e modelar o problema de forma adequada, com as teorias mais pertinentes, as organizações podem aumentar substancialmente suas chances de sucesso.

Probabilisticamente, se uma empresa oferece um determinado produto a um cliente aleatório, as chances de ele adquirir esse produto deveriam ser de 50-50. Seriam as respostas possíveis, sim ou não. Contudo, se a empresa realmente conhecer os clientes, seus perfis, seus comportamentos pregressos e atuais, produtos e serviços semelhantes atualmente consumidos e/ou comprados por clientes similares, capacidades de compra, informações sociodemográficas etc., essa empresa poderá aumentar substancialmente a chance de sucesso nesse processo de venda. Ou seja, ao conhecer o cenário e modelar o problema de forma correta, a empresa poderá determinar probabilidades distintas para cada um dos clientes. Em vez de executar uma ação aleatória de contato para determinado grupo de clientes (assumindo que não seja possível ou financeiramente exequível o contato com toda a base), ela poderá direcionar as ações de vendas de acordo com as probabilidades de conversão, priorizando os clientes com maior probabilidade de compra.

Assim como o participante, ciente do cenário do jogo e das teorias que podem suportar uma resolução do problema, as empresas que avaliam os cenários de negócio, considerando todos os fatores de influência possíveis e possuindo o conhecimento das teorias a serem empregadas na solução dos problemas, podem efetivamente prosperar em um ambiente competitivo. O uso de modelagem estatística e matemática, considerando as teorias pertinentes a cada um dos problemas de negócio, permite que as organizações possam embasar suas decisões em fatos científicos, em probabilidades de ocorrência, e não em conjecturas aleatórias sobre mercados e clientes, ou presunções de cenários. Essa mudança de perspectiva no processo decisório pode e deve fazer toda a diferença a entre ganhar e perder, ainda que em um cenário extremamente complexo como em ambientes competitivos.

Último vídeo

Nossos tópicos