Em 2022, a Inteligência Artificial (IA) se tornou criativa. Agora, os modelos de IA podem produzir texto, imagens e até vídeos notavelmente convincentes, por meio de apenas um pequeno comando de texto.
Faz apenas dez meses que a OpenAI desencadeou uma série de mudanças no ramo da IA generativa com o lançamento do DALL-E 2, um modelo de deep learning que pode produzir imagens a partir de instruções de texto. Em seguida, surgiu uma inovação por parte da Google e da Meta: IAs capazes de produzir vídeos a partir de texto. Além disso, em dezembro, a OpenAI lançou o ChatGPT, o mais recente grande modelo de linguagem para deixar a Internet em polvorosa com sua surpreendente eloquência e coerência.
O ritmo da inovação este ano foi impressionante — e algumas vezes assustador. Quem poderia ter visto isso chegando? E como podemos prever o que vem a seguir?
Will Douglas Heaven e Melissa Heikkilä, da Technology Review americana, contam as quatro maiores tendências que, segundo eles, definirão o cenário da IA em 2023.
Prepare-se para chatbots multifuncionais
GPT-4 pode conseguir lidar com mais do que apenas linguagem
Nos últimos anos temos visto um lançamento constante de modelos de linguagem maiores e melhores. O ponto alto desta tecnologia atualmente é o ChatGPT, lançado pela OpenAI no início de dezembro. Este chatbot é uma versão mais elegante e refinada do GPT-3, também da mesma empresa, que iniciou essa onda de imitações desconcertantes da nossa linguagem em 2020.
No entanto, três anos é muito tempo no ramo da IA. E embora o ChatGPT tenha fascinado o mundo e inspirado inúmeras postagens em redes sociais e manchetes de jornais graças às suas habilidades de conversação fluidas, mas muitas vezes sem sentido, todos os olhos agora estão voltados para a próxima grande novidade: GPT-4. Os investidores e especialistas dizem que 2023 será o ano em que a próxima geração de grandes modelos de linguagem começará.
O que devemos esperar? Para começar, os futuros modelos de linguagem podem ser mais do que apenas isso. A OpenAI está interessada em combinar diferentes modalidades, como reconhecimento de imagem ou vídeo, com texto. Vimos isso com o DALL-E, mas pegue as habilidades de conversação do ChatGPT e misture-as com a manipulação de imagens em um único modelo e você obterá algo muito mais poderoso e para uso geral. Imagine poder perguntar a um chatbot o que há em uma imagem, ou pedir a ele para gerar uma, e fazer com que essas interações sejam parte de uma conversa para que você possa refinar os resultados com mais naturalidade do que já é possível com o DALL-E.
Vimos uma amostra disso com o Flamingo da DeepMind, um “modelo de linguagem visual” revelado em abril de 2022, que pode responder a perguntas feitas sobre imagens exibidas ao software usando uma linguagem natural. Logo depois, em maio, a DeepMind anunciou o Gato, um modelo “generalista” que foi treinado usando as mesmas técnicas por trás de grandes modelos de linguagem para executar diferentes tipos de tarefas, desde descrever imagens a jogar videogames ou controlar um braço de robô.
Se o GPT-4 se basear nessa tecnologia, podemos esperar a potência do melhor modelo de linguagem e dos melhores sistemas de IA de criação de imagens (e mais) em um único conjunto. A combinação de habilidades relacionadas a linguagem e imagens poderia, em teoria, fazer com que a próxima geração de IA entenda melhor a ambos. E não será uma obra somente da OpenAI. Espera-se que outros grandes laboratórios, especialmente o DeepMind, desenvolvam modelos multimodais este ano.
Mas claro, há uma desvantagem. Os modelos de linguagem da próxima geração herdarão a maioria dos problemas já existentes nessa, como a incapacidade de distinguir fatos de ficção e ter uma tendência ao preconceito. Modelos de linguagem melhores dificultarão mais do que nunca confiar em diferentes tipos de mídia. E já que ninguém descobriu completamente como treinar modelos com dados extraídos da internet sem absorver o pior do que há nela, eles ainda estarão repletos de conteúdo impróprio e inadequado.
—Will Douglas Heaven
Os primeiros limites da IA
Novas leis e reguladores rígidos em todo o mundo querem colocar as empresas contra a parede
Até agora, a indústria de IA tem sido uma terra sem lei, com poucas regras que regem o uso e o desenvolvimento da tecnologia. Em 2023 isso vai mudar. Reguladores e legisladores passaram 2022 afiando suas garras. Agora, eles vão dar o bote e atacar.
Veremos como será a versão final da abrangente lei de IA da União Europeia (UE), quando os legisladores terminarem de alterar o projeto de lei, possivelmente até o meio do ano. Quase certamente incluirá proibições de práticas de IA consideradas prejudiciais aos direitos humanos, como sistemas de pontuação e classificação de pessoas quanto a confiabilidade.
O uso de reconhecimento facial em locais públicos também será restrito para a segurança pública na Europa. Há até mesmo um movimento para proibir isso totalmente tanto para as forças de segurança quanto para empresas privadas, embora uma proibição total enfrente forte resistência de países que desejam usar essas tecnologias para combater o crime. A UE também está trabalhando em uma nova lei para responsabilizar as empresas de IA quando seus produtos causam danos ou são prejudiciais, como violações de privacidade ou decisões injustas tomadas por algoritmos.
Nos EUA, a Comissão Federal do Comércio (FTC, em inglês) também está observando atentamente como as empresas coletam dados e usam algoritmos de IA. No início de 2022, a FTC forçou a empresa do ramo de perda de peso Weight Watchers a apagar dados e algoritmos porque havia coletado dados sobre crianças ilegalmente. No final de dezembro, a Epic, que desenvolve jogos como o Fortnite, escapou da mesma sentença ao aceitar pagar um acordo de US$ 520 milhões. A agência de regulação passou 2022 coletando feedback sobre possíveis regras de como as empresas lidam com dados e criam algoritmos, e a presidente da agência Lina Khan disse que o FTC pretende proteger os americanos com “urgência e rigor” do monitoramento comercial ilegal e de práticas de segurança de dados.
Na China, as autoridades proibiram recentemente a criação de deepfakes sem o consentimento do indivíduo. Por meio da lei da IA europeia, os europeus querem adicionar sinais de alerta para indicar que as pessoas estão interagindo com deepfakes ou imagens, áudio ou vídeo gerados por IA.
Todas essas regulamentações podem moldar como as empresas de tecnologia desenvolvem, usam e vendem tecnologias de IA. No entanto, os reguladores precisam encontrar um equilíbrio complicado entre proteger os consumidores e não impedir a inovação — algo que os representantes de grupos de interesse de tecnologia não têm receio de lembrá-los.
A IA é um campo que está se desenvolvendo rapidamente, e o desafio será manter as regras precisas o suficiente para serem eficazes, mas não tão específicas que se tornem desatualizadas rapidamente. Assim como as tentativas da UE para regular a proteção de dados, se as novas leis forem implementadas corretamente, 2023 poderá inaugurar uma era há muito esperada de desenvolvimento de IA com mais respeito pela privacidade e justiça.
—Melissa Heikkilä
Grandes empresas de tecnologia podem perder o domínio quanto às pesquisas fundamentais de IA
Startups de IA mostram sua força
As grandes empresas de tecnologia não são as únicas protagonistas na vanguarda da IA; uma revolução no setor de softwares de código aberto começou a igualar, e às vezes até mesmo a superar, o que os laboratórios mais ricos estão fazendo.
Em 2022, vimos o primeiro grande modelo de linguagem multilíngue desenvolvido coletivamente, o BLOOM, lançado pela Hugging Face. Também vimos uma explosão de inovação em torno do modelo de IA de código aberto de geração de imagem a partir de texto chamado Stable Diffusion, que se tornou rival do DALL-E 2 da OpenAI.
As grandes empresas que historicamente dominaram a pesquisa de IA estão realizando demissões em massa e congelamentos nas contratações à medida que as perspectivas econômicas globais se tornam sombrias. De acordo com Oren Etzioni, presidente da Allen Institute for AI, uma organização de pesquisa, o desenvolvimento de IA é algo caro e, com o orçamento reduzindo, as empresas terão que ter muito cuidado ao escolher em quais projetos investir e provavelmente escolherão o que tiver potencial para gerar mais dinheiro, ao invés do que for mais inovador e interessante ou mais experimentais.
Esse foco nos resultados já está em vigor na Meta, que reorganizou suas equipes de pesquisa de IA e transferiu muitas delas para trabalhar em desenvolvimento de IA para uso comercial em seus produtos.
Mas enquanto as grandes empresas de tecnologia estão cortando custos, novas empresas iniciantes que trabalham em IA generativa estão vendo um aumento no interesse por parte dos fundos de capital de risco.
De acordo com Etzioni, 2023 pode ser uma benção para as startups de IA. Há muito talento por aí e, muitas vezes, em recessões, as pessoas tendem a repensar suas vidas, voltando para o setor acadêmico ou trocando uma grande corporação por uma startup, por exemplo.
De acordo com Mark Surman, diretor-executivo da Mozilla Foundation, as startups e o meio acadêmico podem se tornar os centros da pesquisa fundamental.
“Estamos entrando em uma era em que [a pauta de pesquisa de IA] será menos definida pelas grandes empresas”, diz ele. “Essa é uma oportunidade a ser aproveitada”.
—Melissa Heikkilä
A grande indústria farmacêutica nunca mais será a mesma
De bancos de proteínas produzidos por IA a medicamentos projetados por IA, a biotecnologia entra em uma nova era
Nos últimos anos, ficou claro o potencial da IA para impactar a indústria farmacêutica. O AlphaFold da DeepMind, uma IA que pode prever as estruturas das proteínas (o que define suas funções no corpo humano), abriu caminho para novos tipos de pesquisa em biologia molecular, ajudando os pesquisadores a entender como as doenças funcionam e como criar medicamentos para tratá-las. Em novembro de 2022, a Meta revelou o ESMFold, um modelo muito mais rápido de previsão de estrutura de proteínas, que funciona como uma espécie de preenchimento automático (como nos teclados de celulares) para proteínas, usando uma técnica baseada em grandes modelos de linguagem.
A DeepMind e Meta produziram estruturas para centenas de milhões de proteínas, incluindo todas as conhecidas pela ciência, e as compartilharam em imensos bancos de dados públicos. Biólogos e fabricantes de medicamentos já estão se beneficiando desses recursos, que tornam a pesquisa de novas estruturas de proteínas quase tão fácil quanto pesquisar na web. Mas 2023 pode ser o ano em que essas atividades realmente darão frutos. A DeepMind separou seu trabalho no setor de biotecnologia em uma empresa à parte, a Isomorphic Labs, que tem se mantido em silêncio e revelado pouca informação há mais de um ano. Há uma boa chance de lançar algo grande este ano.
Mais adiante na linha de desenvolvimento de medicamentos, agora há centenas de startups explorando maneiras de usar a IA para acelerar a descoberta de medicamentos e até mesmo criar remédios anteriormente desconhecidos. Atualmente, existem 19 medicamentos desenvolvidos por empresas farmacêuticas de IA em estudos clínicos (esse número era zero em 2020), com mais a serem enviados para estudos nos próximos meses. É possível que os resultados iniciais de alguns deles em 2023, permitindo que o primeiro medicamento desenvolvido com a ajuda da IA chegue ao mercado.
Mas os estudos clínicos podem levar anos para serem finalizados, então é melhor esperar sentado. Mesmo assim, a era da indústria pharmatech chegou e não há como retroceder. De acordo com Lovisa Afzelius, da Flagship Pioneering, uma empresa de capital de risco que investe em biotecnologia, “se for bem-feito, acho que veremos algumas coisas inacreditáveis e surpreendentes acontecendo neste setor”.
—Will Douglas Heaven