Algoritmos, avatares e chat: como a IA está chegando até nós
Inteligência artificial

Algoritmos, avatares e chat: como a IA está chegando até nós

Algo incrível está acontecendo no mundo da Inteligência Artificial e, a menos que você seja uma pessoa offline ou fora das redes sociais, já está percebendo esses avanços de forma prática.

É bem provável que você já tenha sido impactado pelo gerador de imagens Dall-E ou pela ferramenta criativa de geração de texto ChatGPT, da OpenAI. Se não for o caso, eu não duvido que tenha se deparado com a publicação de avatares futurísticos de seus amigos no Instagram, gerados pelo app da Lensa — um frenesi em dezembro, especialmente no Brasil. Mas o que está por trás de todos esses novos recursos disponíveis para as pessoas comuns? Os avanços das pesquisas e desenvolvimento da área de processamento de linguagem natural. O que, na ponta, significa uma capacidade maior de sistemas processarem e gerarem dados, textos e imagens automáticos a um custo, velocidade e esforço computacional muito menor. É a partir desta nova base que muitos novos negócios estão sendo criados, levando os avatares, os chats, uma personalização de serviços e experiências às pessoas, usuários e consumidores.

A interação entre humanos e IA

“É difícil prever o futuro exato da Inteligência Artificial (IA) pois é um campo em rápido desenvolvimento e há muitas direções possíveis. É provável que a IA continue avançando e se tornando cada vez mais integrada a vários setores e aspectos da vida cotidiana. Uma área na qual provavelmente terá impacto é no desenvolvimento de sistemas que possam interagir com humanos de maneiras mais naturais e intuitivas. O que inclui o desenvolvimento de recursos de processamento de linguagem natural mais avançados, bem como o de assistentes inteligentes que possam entender e responder às necessidades e desejos humanos.”

O texto acima não é meu. Foi gerado em 39 segundos pelo ChatGPT, ferramenta criada pela OpenAI, quando digitei a pergunta: ‘qual é o futuro da Inteligência Artificial?’. Acessível a qualquer pessoa, de graça, o ChatGPT foi lançado no fim de novembro e, em menos de uma semana, já tinha ultrapassado 1 milhão de usuários. É projetado para gerar respostas a uma variedade imensa de tópicos e questionamentos humanos com algoritmos que recorrem a um grande escopo de informações armazenadas para produzir uma resposta. Os usuários também podem pedir à IA para escrever ensaios, poemas ou roteiros, ou mesmo traduzir um texto. Até brinquei de perguntar o que o software achava que Shakespeare escreveria a respeito dos problemas da sociedade do século 21:

“Provavelmente continuaria falando de questões que prevalecem na sociedade moderna como desigualdade social, injustiça, e dilemas humanos”. Mas a resposta também veio com a ponderação: “o escritor britânico viveu em um período muito diferente e tinha um estilo de escrita único, moldado pelo contexto cultural e histórico de sua própria época [século XVI].”

É fascinante brincar com o chat, como se tivesse em uma conversa com um amigo, uma sensação que dificilmente sentimos quando somos atendidos por chatbot da operadora ou do banco.

O ChatGPT foi construído a partir de um “grande modelo de linguagem”, chamado de GPT-3 — que usa aprendizagem profunda para produzir texto semelhante ao humano. Os fundadores da OpenAI se beneficiaram dos esforços recentes em termos de pesquisa científica de aprendizado de máquina e de abordagens de redes neurais. O software que está no ar, porém, não é preciso o tempo todo — e pode escrever respostas plausíveis, mas também incorretas ou sem sentido. Muito do que entrega também depende da forma como interagimos com ele.

Como a história da humanidade é vista pela Inteligência Artificial?

Essa é a pergunta que norteou um documentário lançado em julho pelo historiador Yuval Harari. O filme dispensou ilustradores, fotógrafos, operadores de câmera e até especialistas em narração e animação. De produção humana veio o roteiro escrito. O restante foi inventado, criado, narrado e materializado por três modelos de Inteligência Artificial, que incluem vários novos protocolos e algoritmos. Profissionais de edição fizeram o ajuste fino a partir de 400 imagens e animações geradas pela IA. O resultado é instigante e pode ser visto no YouTube.

Veja o vídeo aqui

Experimentos como esse já começam a abrir todo um futuro possível no audiovisual. Um mercado que já é impactado pela produção virtual digital que vem permitindo a estúdios gerarem cenas e animações inteiras com um grande painel de LED, sem construírem cenários em tamanho real ou exigir a equipes viajarem a cenários distantes. Lembre-se que mais de 50% do The Mandalorian foi filmado em cenário digital. Há uma história bacana sendo escrita em todos esses movimentos que só são possíveis graças ao avanço de diversas tecnologias, da pesquisa em linguagens e modelos de IA. E mais do que isso: é uma história que já muda a forma como nós, humanos, podemos ser criativos, trabalhar e gerar cenários imprevisíveis a partir da interação com esses sistemas. A febre recente dos avatares criados pelo app da Lensa mostrou que muita gente está gostando dessas novas possibilidades, criando novas imagens de si mesmos. E cada vez mais personalizadas.

Os riscos, a ética e a receita

O outro lado dessa história também é que já há muita gente preocupada, na área de ética de uso de IA, com o potencial de desinformação que essas novas ferramentas podem gerar. A Meta, por exemplo, anunciou o Galactica, software de IA que utiliza o um modelo de linguagem semelhante ao GPT-3, da OpenAI, com o objetivo de “armazenar, combinar e raciocinar sobre o conhecimento científico”. Três dias depois, desativou-o após usuários acusarem o software de respostas tendenciosas ou de produzir discurso de ódio. O próprio app dos avatares criado pela Lensa sofreu críticas pela forma enviesada como gerou retratos de mulheres e de minorias, por exigir um número grande de fotos do usuário para ser capaz de gerar uma imagem renderizada, e até por ameaçar o trabalho de ilustradores que podem ser marginalizados com essa automação, como relatou o Mashable.

No caso do ChatGPT, é preciso talvez dosar expectativas para aproveitar o que a ferramenta pode ser capaz de entregar. Alberto Romero, na newsletter The Algorithmic Bridge, disse que o potencial está justamente em olhá-la mais como ‘um brinquedo que aumenta a imaginação’ do que como uma ferramenta baseada na verdade ou na realidade concreta. “Não devemos qualificar o ChatGPT como mais ou menos inteligente do que os humanos, mas como mais ou menos adequado para uma determinada tarefa e, quando o deixamos livre do fardo de substituir nossa criatividade há um potencial para ser explorado em termos de automação de tarefas, trabalhos administrativos, recomendações de referências ou ferramentas de codificação”, analisou Romero.

Além de lidar com as expectativas geradas pela nova interação entre homens-máquina que tem proporcionado, a OpenIA também precisa saber como vai transformar esse recurso em receita. No começo de dezembro, Elon Musk perguntou ao fundador da empresa, no Twitter, qual era o custo médio por interação. Sam Altman respondeu que provavelmente é de centavos por cada dígito, mas que ainda estava tentando descobrir com precisão.

Gary Marcus, autor de Rebooting AI, escreveu que atualmente já é possível criar e treinar um grande modelo de linguagem, que automatiza a geração de textos ou imagens, por menos de US$ 500 mil. E ele projeta que, em breve, o preço cairá mais. O grande alerta que ele traz é que os grandes modelos de linguagem são ótimos para gerar desinformação, mas muito ruins para combatê-las. E que talvez será preciso criar um novo tipo de IA para contrabalancear tudo o que está sendo gerado e desencadeado.

Abrindo um novo potencial

Tudo sempre tem dois lados e qualquer negócio, empreendedor ou executivo precisa levar em conta os riscos — éticos, de cibersegurança e desinformação — na hora de adotar esses novos modelos de linguagem. Mas o principal ponto é que nós já estamos sendo afetados por eles. E é bem provável que fiquemos todos viciados nessa nova forma de interação que o desenvolvimento de novas linguagens está trazendo à tona. São sinais para onde caminhamos em termos de hiperpersonalização, de automação de tarefas, de novas rotinas pessoais com assistentes cada vez mais inteligentes. “Isso é como o início da era da Internet, bem na década de 1990, quando todo mundo pensava: o que estamos vendo aqui?”, refletiu Varun Mayya, CEO da empresa de software Avalon Labs. Estamos vendo o começo de uma nova era. Era uma vez a Inteligência Artificial tal qual conhecíamos.


Este artigo foi produzido por Guga Stocco, membro do Conselho de Administração do Banco Original, Totvs, Vinci e Grupo Soma, fundador da Futurum Capital e colunista da MIT Technology Review Brasil.

Último vídeo

Nossos tópicos