Recentemente, fiz uma pesquisa e percebi que muitos modelos de IA chineses são mais acessíveis no exterior do que eu esperava. Você pode acessar a maioria deles registrando contas em seus sites ou usando plataformas populares de código aberto, como a Hugging Face. Por isso, publiquei este guia prático que lista uma dúzia dos principais chatbots chineses de Large Language Models (LLM) que você pode usar e os métodos para acessá-los facilmente em minutos, de qualquer lugar do mundo.
Durante meus experimentos com esses modelos, uma coisa logo ficou clara: embora a maioria das empresas chinesas de IA tenha estabelecido um nível mais alto de acesso a seus produtos do que seus equivalentes ocidentais, uma tendência de modelos de IA de código aberto está tornando-os cada vez mais acessíveis a um público estrangeiro.
Veja o Qwen (ou Tongyi Qianwen, conforme chamado em chinês), por exemplo. Esse é o principal modelo de fundação de IA do Alibaba. Diferentemente dos concorrentes domésticos da empresa, como Baidu, ByteDance ou Tencent, a Alibaba optou por oferecer o Qwen como um modelo de código aberto e permitir que desenvolvedores e clientes comerciais o utilizem gratuitamente.
O modelo, que acabou de receber uma grande atualização 2.0 em junho deste ano, recebeu muito reconhecimento internacional. Na classificação mais recente da Hugging Face, que compara o desempenho de todos os principais LLMs de código aberto, o Qwen2 foi classificado em primeiro lugar, superando o Llama 3 da Meta e o Phi-3 da Microsoft.
Da mesma forma, algumas startups chinesas, como a DeepSeek e a 01.AI, também decidiram tornar seus modelos de código aberto, e o desempenho de seus produtos LLM também lhes rendeu uma posição elevada na tabela de classificação. Empresas como essas estão oferecendo seus modelos gratuitamente para pessoas dentro e fora da China.
A pergunta natural a ser feita é: por quê? O que significa IA de código aberto e por que essas empresas estão apostando que tornar seus modelos mais abertos e acessíveis será uma boa decisão comercial?
Para o Alibaba, trata-se de uma estratégia para expandir seus negócios na nuvem, diz Kevin Xu, investidor em tecnologia e fundador da Interconnected Capital. “A simples consideração econômica é que, se seu modelo de código aberto se tornar popular, mais pessoas usarão o Alibaba Cloud para criar aplicativos de IA usando os modelos de código aberto do Alibaba, e isso obviamente beneficiará o Alibaba Cloud como negócio”, diz ele.
Tudo o que a Alibaba fez em IA de código aberto – liberando seus próprios modelos para o público e criando uma plataforma de código aberto que imita o Hugging Face, na esperança de reunir a comunidade de IA na China – serve ao propósito de fazer com que mais pessoas se inscrevam no Alibaba Cloud e paguem para usar seus servidores.
Mesmo para as startups chinesas de IA que não estão no negócio de nuvem, a IA de código aberto ainda oferece um manual testado e comprovado para uma comercialização mais rápida. No lado do desenvolvimento, ela permite que elas adaptem modelos de código aberto estabelecidos, como o Llama da Meta, para acelerar o processo de desenvolvimento de produtos. No que diz respeito ao mercado, ela os incentiva a pensar em arquiteturas de modelos alternativos que possam ajudá-los a se destacar do mercado convencional.
“No momento, a IA no Ocidente tende a ter uma visão muito fixa de como tornar um modelo de IA melhor, [que] é apenas adicionar mais dados ou aumentar a escala”, diz Eugene Cheah, fundador da Recursal AI, uma plataforma de IA de código aberto, com sede em São Francisco. É extremamente difícil para os pequenos retardatários do setor de LLM jogarem esse jogo e desenvolverem um modelo que rivalize com o GPT-4 ou o Gemini quando a OpenAI e o Google têm uma vantagem enorme em recursos de computação.
O problema é ainda mais grave para as empresas chinesas, pois os controles de exportação dos EUA significam que elas não podem acessar facilmente chips de última geração. “Como eles estão limitados pela escassez de GPUs”, diz Cheah,“vejo os grupos chineses dispostos a experimentar ideias malucas para aprimorar o modelo. E algumas dessas coisas estão dando resultados” – elas levaram a modelos mais eficientes que são mais baratos para treinar e usar, o que pode atrair clientes preocupados com o orçamento e ajudar as empresas chinesas a encontrar um nicho de mercado ao lado dos gigantes da IA.
Por que isso é importante? Por um lado, esses modelos de IA de código aberto apresentam um futuro alternativo em que o setor não é dominado apenas por participantes com grandes recursos, como OpenAI, Microsoft e Google. E também mostram que os cientistas e as empresas chinesas são capazes de criar LLMs de código aberto de última geração que podem até mesmo superar os produtos de suas contrapartes ocidentais.
Xu observa que a Abacus AI, uma startup sediada em São Francisco, lançou um modelo este ano que foi adaptado e ajustado a partir do modelo Qwen de código aberto da Alibaba. Ele é até mesmo chamado de “Qwen liberado”.
A introdução, pelas empresas chinesas de IA, de modelos de alto desempenho que as startups dos EUA podem usar como base, é um exemplo do melhor cenário de IA de código aberto, “em que todos constroem uns sobre os outros como um ciclo de desenvolvimento positivo”, diz Xu. “Não se trata apenas de uma única direção em que as empresas chinesas estão pegando tudo o que há de melhor nos EUA, mas, agora as coisas estão [também] voltando para o outro lado.”
—