Dentro de um espaço de coworking no bairro de Rosebank, em Joanesburgo, Jade Abbott abriu uma aba em seu computador e pediu ao ChatGPT que contasse de 1 a 10 em isiZulu, um idioma falado por mais de 10 milhões de pessoas em sua terra natal, a África do Sul. Os resultados foram “mistos e hilários”, diz Abbott, cientista da computação e pesquisadora.
Em seguida, ela digitou algumas frases em isiZulu e pediu ao chatbot para traduzi-las para o inglês. Novamente, as respostas? Nem perto do correto. Embora já tenham sido feitos esforços para incluir certos idiomas em modelos de IA (mesmo quando há poucos dados disponíveis para treinamento), para Abbott, esses resultados mostram que a tecnologia “ainda não está captando nossos idiomas.”
A experiência de Abbott reflete a realidade enfrentada por africanos que não falam inglês. Muitos modelos de linguagem, como o ChatGPT, não apresentam um bom desempenho com idiomas falados por um número menor de pessoas, especialmente os africanos. No entanto, uma nova iniciativa chamada Lelapa AI, uma colaboração entre Abbott e a engenheira biomédica Pelonomi Moiloa, está tentando usar aprendizado de máquina para criar ferramentas projetadas especificamente para falantes de idiomas africanos.
O Vulavula, uma nova ferramenta de IA lançada hoje pela Lelapa, converte voz em texto e detecta nomes de pessoas e lugares em textos escritos (o que pode ser útil para resumir documentos ou encontrar alguém online). Atualmente, a ferramenta pode identificar quatro idiomas falados na África do Sul—isiZulu, Afrikaans, Sesotho e inglês—e a equipe está trabalhando para incluir outros idiomas do continente.
A ferramenta pode ser usada de forma independente ou integrada a outras ferramentas de IA existentes, como o ChatGPT e chatbots online. A expectativa é que o Vulavula, que significa “falar” em Xitsonga, torne acessíveis ferramentas que atualmente não oferecem suporte a idiomas africanos.
A falta de ferramentas de IA que funcionem para idiomas africanos e reconheçam nomes e lugares do continente exclui africanos de oportunidades econômicas, diz Moiloa, CEO e cofundadora da Lelapa AI. Para ela, desenvolver soluções de IA centradas na África é uma maneira de ajudar outras pessoas no continente a aproveitar os imensos benefícios das tecnologias de IA. “Estamos tentando resolver problemas reais e devolver o poder às mãos do nosso povo”, afirma.
“Não podemos esperar por eles”
Existem milhares de idiomas no mundo, e entre 1.000 e 2.000 deles são falados apenas na África—estima-se que o continente responda por um terço de todos os idiomas do planeta. No entanto, embora falantes nativos de inglês representem apenas 5% da população global, a língua domina a internet—e agora também as ferramentas de IA.
Já existem algumas iniciativas para corrigir esse desequilíbrio. O GPT-4, da OpenAI, incluiu idiomas minoritários como o islandês. Em fevereiro de 2020, o Google Tradutor passou a oferecer suporte a cinco novos idiomas falados por cerca de 75 milhões de pessoas. Mas as traduções ainda são superficiais. Além disso, segundo pesquisadores africanos de IA, a ferramenta frequentemente erra ao lidar com idiomas africanos, o que está longe de representar com precisão esses idiomas no ambiente digital.
No início deste ano, por exemplo, o cientista da computação etíope Asmelash Teka Hadgu realizou os mesmos experimentos que Abbott fez com o ChatGPT durante uma importante conferência de IA na África, em Kigali, Ruanda. Quando ele fez perguntas ao chatbot em sua língua materna, o tigrínia, as respostas que obteve foram ininteligíveis. “Ele gerou palavras que não fazem sentido”, diz Hadgu, cofundador da Lesan, uma startup de IA baseada em Berlim que desenvolve ferramentas de tradução para idiomas etíopes.
A Lelapa AI e a Lesan são apenas duas das startups que estão desenvolvendo ferramentas de reconhecimento de fala para idiomas africanos. Em fevereiro, a Lelapa AI arrecadou US$ 2,5 milhões em financiamento inicial e planeja uma nova rodada de captação para 2025. No entanto, empreendedores africanos afirmam que enfrentam grandes desafios, incluindo falta de financiamento, acesso limitado a investidores e dificuldades para treinar a IA na diversidade dos idiomas africanos. “A IA recebe o menor financiamento entre as startups de tecnologia africanas”, diz Abake Adenle, fundadora da AJALA, uma startup londrina que desenvolve automação de voz para idiomas africanos.
As startups de IA que trabalham para desenvolver produtos que trabalhem com idiomas africanos costumam ser ignoradas pelos investidores, afirma Hadgu. Isso acontece devido ao tamanho reduzido do mercado potencial, à falta de apoio político, e à infraestrutura precária da internet. No entanto, Hadgu destaca que pequenas startups africanas, como Lesan, GhanaNLP e Lelapa AI, estão desempenhando um papel importante: “As grandes empresas de tecnologia não dão atenção aos nossos idiomas”, diz, “mas não podemos esperar por elas.”
Um modelo para a IA africana
A Lelapa AI está tentando criar um paradigma para modelos de IA na África, afirma Vukosi Marivate, cientista de dados da equipe de IA da empresa. Em vez de coletar dados exclusivamente da internet para treinar seus modelos, como fazem as empresas do Ocidente, a Lelapa AI trabalha tanto online quanto offline com linguistas e comunidades locais para reunir dados, anotá-los e identificar casos em que a ferramenta possa apresentar problemas.
Bonaventure Dossou, pesquisador da Lelapa AI especializado em processamento de linguagem natural (NLP), afirma que trabalhar com linguistas permite o desenvolvimento de um modelo mais contextualizado e culturalmente relevante. “Incorporar a sensibilidade cultural e perspectivas linguísticas melhora o sistema tecnológico”, diz Dossou. Por exemplo, a equipe da Lelapa AI criou algoritmos de análise de sentimento e tom adaptados a idiomas específicos.
Marivate e seus colegas da Lelapa AI visualizam, ainda, um futuro no qual as tecnologias de IA funcionem para os africanos e os representem. Em 2019, Marivate e Abbott fundaram a Masakhane, uma iniciativa comunitária que visa promover a pesquisa em NLP para idiomas africanos. Atualmente, a iniciativa conta com milhares de voluntários, programadores e pesquisadores trabalhando juntos para construir modelos de NLP centrados na África.
Moiloa enfatiza a importância de o Vulavula e outras ferramentas de IA serem desenvolvidas por africanos, e para africanos: “Somos os guardiões dos nossos idiomas. Nós é que devemos construir as tecnologias que funcionem para eles.”