A etapa que falta entre hype e lucro
Inteligência artificial

A etapa que falta entre hype e lucro

Deixando a codificação de lado, até mesmo os melhores sistemas de IA têm dificuldade para ser economicamente viáveis no ambiente de trabalho. O que acontece então?

Em fevereiro, peguei um panfleto em uma marcha anti-IA na cidade de Londres. Não posso dizer com certeza se os autores pretendiam fazer uma referência aos gnomos roubadores de cueca da série animada “South Park”, mas, se pretendiam, acertaram em cheio: “Passo 1: cultivar uma supermente digital”, dizia. “Passo 2: ? Passo 3: ?”

Mini Banner - Assine a MIT Technology Review

Produzida pela “Pause IA”, um grupo ativista internacional que coorganizou o protesto, o panfleto acabava com um apelo ao leitor: “Pare a IA até sabermos que diabos é o Passo 2”.

No episódio “Gnomos”, de “South Park”, exibido pela primeira vez em 1998, os personagens Kenny, Kyle, Cartman e Stan descobrem uma comunidade de gnomos que sai sorrateiramente à noite para roubar cuecas de gavetas. Por quê? Os gnomos apresentam a plataforma deles: “Fase 1: arrecadar cuecas. Fase 2: ? Fase 3: Lucro.”

Desde então, o plano de negócios dos gnomos se tornou um dos grandes clássicos entre os memes da Internet, usado para satirizar tudo, de estratégias de startups a propostas políticas. O “chefe dos especialistas em memes”, Elon Musk, já fez referência a esse episódio durante uma fala sobre como pretendia financiar uma missão a Marte. Agora, isso retrata o estado da IA. As empresas construíram a tecnologia (Passo 1) e prometeram transformação (Passo 3). Como eles chegam lá ainda é um ponto de interrogação.

No entendimento da “Pause IA”, o Passo 2 precisa envolver algum tipo de regulação, mas o que ela exigirá exatamente e quem fará com que ela seja cumprida ainda são temas de debate.

Os entusiastas da IA, por outro lado, estão convencidos de que o Passo 3 é salvação e tendem a passar batido pela parte do meio. Eles nos veem correndo rumo a um futuro ensolarado nas costas de uma “tecnologia economicamente transformadora”, como o cientista-chefe da OpenAI, Jakub Pachocki, me disse há algumas semanas. Eles sabem para onde querem ir, mais ou menos: lá em cima é nebuloso e ainda está a alguma distância, mas cada um está seguindo por um caminho diferente. Todos vão chegar? Alguém vai?

Para cada grande afirmação sobre o futuro, há uma avaliação mais sóbria onde a teoria encontra a prática, uma que esfria o hype. Considere dois estudos recentes. Um, da Anthropic, previu quais tipos de empregos serão mais afetados por LLMs (uma conclusão: gestores, arquitetos e pessoas da mídia devem se preparar para mudanças; jardineiros, trabalhadores da construção, profissionais de hotelaria e de serviços de atendimento, nem tanto). Mas essas previsões são, na verdade, apenas palpites, baseados em que tipos de tarefas os LLMs parecem fazer bem, e não em como de fato se saem no ambiente de trabalho.

Outro estudo, divulgado em fevereiro por pesquisadores da Mercor, uma startup de contratação com IA, testou vários agentes de IA, alimentados por modelos de primeira linha da OpenAI, da Anthropic e do Google DeepMind, em 480 tarefas de trabalho frequentemente realizadas por banqueiros, consultores e advogados humanos. Todos os agentes testados falharam em concluir a maioria das funções.

Por que há tamanha divergência? Existem vários fatores. Para começar, é crucial considerar quem está fazendo as afirmações (e por quê). A Anthropic tem interesse direto nisso. Além do mais, a maioria das pessoas que nos diz que algo grande está prestes a acontecer chegou a essa conclusão, principalmente, com base na rapidez com que as ferramentas de IA para programação estão melhorando. Mas nem todas as tarefas podem ser resolvidas com programação. Outros estudos descobriram, por exemplo, que LLMs são ruins em fazer julgamentos estratégicos.

Além disso, quando são implantadas, as ferramentas não são simplesmente colocadas em uma sala limpa. Elas precisam funcionar em lugares contaminados por pessoas e por fluxos de trabalho já existentes. E, às vezes, adicionar IA vai piorar as coisas. É claro que, talvez, esses fluxos precisem ser desmontados e refeitos em torno da nova tecnologia, para que ela alcance um status transformador, mas isso vai demandar tempo (e ousadia).

Esse buraco enorme? Ele fica exatamente onde o Passo 2 deveria estar. A falta de concordância sobre o que exatamente vai acontecer, e como, cria um vácuo de informação que é preenchido pela mais recente afirmação mirabolante da semana, pouco importando as evidências. Estamos tão sem rumo em relação a qualquer entendimento real do que vem por aí e de como isso será implantado, que um único post em rede social pode (e consegue) sacudir os mercados.

Precisamos de menos palpites e mais evidências. Mas isso vai exigir transparência por parte de quem cria os modelos, coordenação entre pesquisadores e empresas, e novas formas de avaliar essa tecnologia que nos digam o que realmente acontece quando ela é implementada no mundo real.

A indústria de tecnologia (e, com ela, a economia mundial) se apoia na promessa ainda não cumprida de que a IA realmente será transformadora. Mas isso ainda não é uma aposta certa. Da próxima vez que você ouvir afirmações ousadas sobre o futuro, lembre-se de que a maioria das empresas ainda está tentando descobrir o que fazer com suas cuecas.

Último vídeo

Nossos tópicos