Como utilizar o ChatGPT nas organizações?
Inteligência artificial

Como utilizar o ChatGPT nas organizações?

As instituições estão pensando em como aplicar a tecnologia GPT-3 para alavancar o uso de IA em produtos e soluções. Como treinar o algoritmo da OpenAI com dados específicos de cada instituição?

Há uma área de pesquisa que faz a interseção da linguística, da ciência da computação, da Inteligência Artificial e da engenharia das informações: o Processamento de Linguagem Natural (NLP – Natural Language Processing). O NLP tem com um de seus objetivos melhorar a interação com os computadores, por meio de linguagens naturais. O tão falado ChatGPT é um modelo de NLP treinado pela OpenAI – empresa que criou o algoritmo Generative Pre-training Transformer 3 (GPT-3), base para o chat e várias outras aplicações, capaz de responder perguntas e iniciar conversas sobre os mais diversos assuntos.  

O GPT-3 é fundamentado em um tipo de rede neural de linguagem chamada Transformer, a qual foi projetada para lidar com dados sequenciais, como texto, e foi treinada em uma extensa gama de documentos escritos da Internet, incluindo notícias, artigos científicos, livros, fóruns online e muito mais.  

E por que o GPT-3 está causando tanto barulho?  

Primeiro, porque é extremamente rápido e com capacidade de responder com naturalidade uma ampla variedade de assuntos. Segundo que o modelo utiliza a maior quantidade de parâmetros de aprendizado de máquina (Machine Learning) já visto: são 175 bilhões de parâmetros, que, de forma simplista, seriam variáveis de configuração interna ao modelo que ajudam o algoritmo a responder adequadamente às questões, fazer previsões e definem a habilidade do modelo para resolver problemas. Para fins de comparação, a versão inicial do GPT tinha 117 milhões de parâmetros, a GPT-2 1,5 bilhões, o modelo Turing Natural Language Generation (T-NLP) da Microsoft — o maior até então — 17 bilhões. Já os humanos teriam capacidade de armazenar e analisar, em média, de 5 a 9 parâmetros, segundo George Armitage Miller, um dos criadores da ciência cognitiva moderna.  

Assim, o GPT-3 seria um passo concreto para chegarmos à Inteligência Artificial Geral, aquela que encontramos nos filmes, um sistema completo, praticamente indistinguível de um ser humano. O avanço é tão significativo, que seria possível treinar o algoritmo para escrever utilizando o estilo de linguagem de uma pessoa específica. Já pensou em termos um novo romance escrito pela IA treinada para utilizar o estilo de Machado de Assis? 

Mas como treinar o GPT-3 com dados de uma instituição? 

O treinamento do GPT-3 com dados de uma organização tem vários passos. Além disso, é fundamental que se tenha uma equipe especializada com conhecimento e uma compreensão profunda de tecnologias de processamento de linguagem natural (NLP), IA e privacidade de dados, bem como conhecimento do negócio. De maneira sucinta, os passos para a utilização do GPT-3 em uma organização seriam: 

  1. Autorização formal: é necessário obter a autorização formal e explícita da organização para usar os dados para treinar o GPT-3, pois esses dados serão enviados para a nuvem do algoritmo. A organização deve também se precaver sobre o uso adequado das informações, garantindo a proteção da privacidade dos titulares de dados pessoais.
  2.  Definição do problema: a arte de fazer a pergunta correta será a nova forma de programação. É importante delinear o problema relevante que precisa ser resolvido, por meio da coleta e análise de dados, com a necessária contextualização e estabelecimento de objetivos claros. 
  3. Preparação dos dados: a preparação dos dados da organização para o treinamento não é uma tarefa trivial. Isso pode incluir a remoção de dados pessoais, a criptografia dos dados sensíveis e a verificação de que todos os dados sejam de fontes confiáveis e de acordo com as políticas de privacidade da organização. Além disso, pode ser necessária a formatação dos dados para serem mais bem compreendidos pelo algoritmo, de forma a aumentar a acuracidade do modelo. 
  4. Treinamento do modelo: Aí passamos para o treinamento do modelo GPT-3, por meio da API da OpenAI ou outra ferramenta de treinamento de modelos de linguagem. Isso pode incluir o uso do fine-tuning para ajustar o modelo para atender às necessidades específicas da organização. 
  5. Validação e implantação: finalmente, deve-se validar o desempenho do modelo treinado, para que ele possa ser implantado em produção de acordo com as diretrizes da organização. E o processo deve entrar em uma rotina de melhoria contínua, sempre aperfeiçoando e fazendo os ajustes finos para melhorar o resultado. 

E quanto custa? 

Não é gratuito. E pode ser muito caro. Como vimos, o treinamento do GPT-3 é realizado através do OpenAI API, que cobra por uso. O custo exato depende de três variáveis: o tamanho do modelo; a quantidade de dados utilizados para o treinamento; e a quantidade de recursos de computação necessários. É importante notar que o treinamento de modelos de linguagem de grande porte, como o GPT-3, pode ser muito oneroso e necessitar de grandes recursos computacionais. 

Além disso, é importante considerar os custos associados à equipe de TI, inovação, negócio e privacidade de dados que precisarão ser envolvidas para garantir que o treinamento seja realizado de maneira ética e de acordo com as políticas de privacidade da organização. 

E o futuro? 

Em resumo, treinar o GPT-3 com dados de uma organização é uma tarefa complexa que requer autorização explícita, preparação cuidadosa dos dados, recursos computacionais substanciais e conhecimento especializado em tecnologias de processamento de linguagem e privacidade de dados. É importante considerar cuidadosamente as questões éticas e legais, o que pode requerer uma análise jurídica. 

De qualquer forma, Sam Altman, CEO da OpenAI, disse em um tweet que “o ChatGPT é incrivelmente limitado, mas bom o suficiente em algumas coisas para criar uma impressão enganosa de grandeza”. E ele continua, afirmando que “é um erro confiar nele para qualquer coisa importante agora”, pois ainda há “muito trabalho a fazer em robustez e veracidade”. Ou seja, pode-se concluir que a IA certamente terá um papel fundamental para as economias globais, revolucionando a nossa vida cotidiana e o nosso relacionamento com a máquina — mas que esse é um caminho ainda sendo traçado.  

No entanto, o futuro já está batendo à nossa porta. A sociedade e governos devem trabalhar para direcionar esse futuro da IA geral para o benefício de todos e para evitar que a IA seja utilizada para exacerbar ainda mais a exploração e discriminação de grupos vulneráveis. Esse direcionamento já começou a ser discutido na Europa e no Brasil, por meio de propostas de regulamentação que, contudo, foram criadas antes do GPT-3. Com isso, é certo que tais regulamentações necessitem de ajustes para não correrem o risco de já caducarem antes de nascerem. 

 

*As opiniões contidas no texto são pessoais e não expressam o posicionamento institucional do Tribunal de Contas do Estado de São Paulo. 


Este artigo foi produzido por Fabio Correa Xavier, Diretor do Departamento de Tecnologia da Informação do TCESP, Mestre em Ciência da Computação, Professor e colunista da MIT Technology Review Brasil.

Último vídeo

Nossos tópicos