Foi uma IA que detectou o coronavírus pela primeira vez, ou é o que dizem. Em 30 de dezembro, uma empresa de Inteligência Artificial (IA) chamada BlueDot, que usa machine learning para monitorar surtos de doenças infecciosas em todo o mundo, alertou os clientes – incluindo vários governos, hospitais e empresas – sobre um aumento de casos incomum de pneumonia em Wuhan, China. Faltariam ainda nove dias para a Organização Mundial da Saúde (OMS) sinalizar oficialmente o que todos conhecemos como Covid-19. BlueDot não estava sozinha. Um serviço automatizado chamado HealthMap no Hospital Infantil de Boston também detectou esses primeiros sinais. Assim como um modelo dirigido pela Metabiota, com sede em São Francisco. É bastante impressionante que a IA possa identificar um surto do outro lado do mundo, e todos sabemos que os primeiros avisos salvam vidas.
Mas o quanto realmente a IA contribuiu para lidar com a atual pandemia? Esta é uma pergunta difícil de responder. Empresas como a BlueDot geralmente não falam para quem fornecem informações e como elas são usadas exatamente. E suas equipes humanas dizem que notaram o surto no mesmo dia que as IAs. Outros projetos que estão tentando usar a IA como uma ferramenta de diagnóstico ou para ajudar a encontrar uma vacina ainda estão em seus estágios iniciais. Mesmo que sejam bem-sucedidos, levará tempo – possivelmente meses – para disponibilizar essas inovações aos profissionais de saúde que precisam.
A expectativa supera a realidade. De fato, o que tem aparecido em muitos noticiários e comunicados de imprensa – que a IA é uma nova arma poderosa contra doenças – é apenas parcialmente verdade e corre o risco de se tornar contraproducente. Por exemplo, o excesso de confiança nas capacidades da IA pode levar a tomada de decisões precipitadas por informações equivocadas que canalizam dinheiro público para empresas de IA desconhecidas à custa de intervenções comprovadas, como programas de medicamentos. Isso também é ruim para a própria área: expectativas exageradas com resultados decepcionantes, levaram a uma queda de interesse na IA – e a consequente perda de financiamento – mais de uma vez no passado.
Então, aqui está uma verdade: a IA não nos salvará do coronavírus – certamente não desta vez. Mas tem todas as chances de desempenhar um papel maior em futuras epidemias – se fizermos grandes mudanças. A maioria não será fácil. Algumas nós não gostaremos.
Existem três áreas principais em que a IA pode ajudar: previsão, diagnóstico e tratamento.
Previsão
Empresas como BlueDot e Metabiota usam uma variedade de algoritmos de Processamento de Linguagem Natural (PLN) para monitorar os noticiários e os relatórios oficiais de assistência médica em diferentes idiomas ao redor do mundo, sinalizando se mencionam doenças de alta prioridade, como coronavírus ou mais endêmicas, como HIV ou tuberculose. Suas ferramentas preditivas também podem recorrer a dados de viagens aéreas para avaliar o risco de centros de conexão (conhecidos também como hubs de trânsito) de receberem pessoas infectadas.
Os resultados são razoavelmente precisos. Por exemplo, o último relatório público da Metabiota, em 25 de fevereiro, previu que em 3 de março haveria 127.000 casos cumulativos em todo o mundo. Mesmo tendo ultrapassado cerca de 30.000, Mark Gallivan, diretor de ciência de dados da empresa, disse que isso ainda está dentro da margem de erro. O documento também listou os países com maior probabilidade de relatar novos casos, incluindo China, Itália, Irã e EUA. De novo: nada mal.
Outras também estão de olho nas redes sociais. A Stratifyd, uma empresa de análise de dados com sede em Charlotte, Carolina do Norte, está desenvolvendo uma IA que analisa postagens em sites como Facebook e Twitter e faz referência cruzada com descrições de doenças retiradas de fontes como o Instituto Nacional de Saúde dos Estados Unidos, a Organização Mundial para Saúde Animal e o banco de dados global de identificadores microbianos, que armazena informações de sequenciamento do genoma.
O trabalho dessas empresas é certamente impressionante. E mostra como o machine learning avançou nos últimos anos. Há alguns anos, o Google tentou prever surtos com o malsucedido serviço online Flu Tracker, arquivado em 2013 quando não conseguiu prever o pico de gripe naquele ano. O que mudou? Tudo se resume à capacidade dos softwares mais recentes de absorverem uma variedade muito maior de fontes.
O machine learning não supervisionado também é fundamental. Permitir que uma IA identifique seus próprios padrões entre os ruídos, em vez de treiná-la em exemplos pré-selecionados, destaca coisas que você talvez não tenha pensado em procurar. “Quando você faz previsões, está procurando um novo comportamento”, diz o CEO da Stratifyd, Derek Wang.
Mas o que você faz com elas? A previsão inicial da BlueDot identificou corretamente algumas cidades no caminho do vírus. Isso poderia ter permitido que as autoridades se preparassem, alertando aos hospitais e implementando medidas de contenção. Mas à medida que a escala da epidemia cresce, as previsões se tornam menos específicas. O alerta da Metabiota de que certos países seriam afetados na semana seguinte pode estar correto, mas é difícil saber o que fazer com essas informações.
Além disso, todas essas abordagens se tornarão menos precisas à medida que a epidemia progride, em grande parte porque obter dados confiáveis sobre a COVID-19 que a IA precisa para se alimentar é difícil. Fontes de notícias e relatórios oficiais oferecem dados inconsistentes. Há confusão quanto aos sintomas e como o vírus é transmitido entre as pessoas. Na mesma medida em que a mídia pode maximizar as coisas; as autoridades podem minimizá-las. E prever onde uma doença pode se espalhar a partir de centenas de locais em dezenas de países é uma tarefa muito mais assustadora do que emitir um aviso sobre onde pode ocorrer um único surto em seus primeiros dias. “O ruído é sempre o inimigo dos algoritmos de machine learning”, diz Wang. De fato, Gallivan reconhece que as previsões diárias da Metabiota eram mais fáceis de se fazer nas duas primeiras semanas.
Um dos maiores obstáculos é a falta de testes de diagnóstico, diz Gallivan. “Idealmente, teríamos um teste para detectar o novo coronavírus imediatamente e testar todo mundo pelo menos uma vez por dia”, diz ele. Também não sabemos realmente quais comportamentos as pessoas estão adotando – quem está trabalhando em casa, quem está em quarentena voluntária, quem está ou não está lavando as mãos – ou que efeito isso pode ter. Se queremos prever o que acontecerá, necessitamos de um quadro preciso do que está acontecendo no momento.
Também não está claro o que se passa dentro dos hospitais. Ahmer Inam, da Pactera Edge, uma consultoria de dados e IA, diz que as ferramentas de previsão seriam muito melhores se os dados de saúde pública não fossem bloqueados pelas agências governamentais, como em muitos países, incluindo os EUA. Isso significa que a IA tem que depender de dados facilmente disponíveis como notícias online com mais frequência. “Quando a mídia toma conhecimento de uma condição médica potencialmente nova, já é tarde demais”, diz ele.
Mas se a IA precisar de muito mais dados de fontes confiáveis para ser útil nessa área, as estratégias para obtê-las podem ser controversas. Várias pessoas com quem falei destacaram essa incômoda situação: para obter melhores previsões com o machine learning, precisamos compartilhar mais dados pessoais com empresas e governos.
Darren Schulte, MD e CEO da Apixio, que construiu uma IA para extrair informações das fichas dos pacientes, acha que os registros médicos de todo os EUA devem ser abertos para análise de dados. Isso poderia permitir que uma IA identificasse automaticamente indivíduos que correm mais riscos com a COVID-19 devido a uma condição médica anterior. Os recursos poderiam então ser focados nas pessoas que mais precisam deles. A tecnologia para ler as fichas dos pacientes e extrair informações que salvam vidas existe, diz Schulte. O problema é que esses registros são divididos em vários bancos de dados e gerenciados por diferentes serviços de saúde, o que dificulta sua análise. “Gostaria de colocar minha IA nesse grande oceano de dados”, diz ele. “Mas nossos dados estão em pequenos lagos, não em um grande oceano.”
Os dados de saúde também devem ser compartilhados entre os países, diz Inam: “Os vírus não operam dentro dos limites das fronteiras geopolíticas”. Ele acha que os países deveriam ser forçados por um acordo internacional a divulgar dados em tempo real sobre diagnósticos e internações hospitalares, que poderiam então ser incorporados em modelos de escala globais de machine learning para pandemia.
Claro, isso pode ser apenas um desejo. Diferentes partes do mundo têm diferentes regulamentos de privacidade para dados médicos. E muitos de nós já nos recusamos a tornar nossos dados acessíveis a terceiros. Novas técnicas de processamento de dados, como privacidade diferencial e treinamento em dados sintéticos, em vez de reais, podem oferecer um caminho para esse debate. Mas esta tecnologia ainda está se aperfeiçoando. Encontrar um acordo sobre padrões internacionais levará ainda mais tempo.
Por enquanto, precisamos aproveitar ao máximo os dados que temos. A resposta de Wang é garantir que os humanos estejam por perto para interpretar o que os modelos de machine learning oferecem, descartando previsões que não parecem verdadeiras. “Se alguém é excessivamente otimista ou depende de um modelo preditivo totalmente autônomo, isso será problemático”, diz ele. As IAs podem encontrar sinais ocultos nos dados, mas os seres humanos devem ligar os pontos.
Diagnóstico precoce
Além de prever o curso de uma epidemia, muitos esperam que a IA ajude a identificar as pessoas que foram infectadas. Neste aspecto, ela tem um bom histórico. Modelos de machine learning que examinam imagens médicas podem detectar sinais precoces de doenças que passam despercebidas pelos médicos, desde doenças oculares a doenças cardíacas e câncer. Mas esses modelos normalmente exigem muitos dados para aprender.
Nas últimas semanas de março, muitas pré-publicações de artigos científicos online foram disponibilizadas, sugerindo que o machine learning pode diagnosticar a Covid-19 a partir de tomografias computadorizadas de tecido pulmonar, se treinado para detectar sinais reveladores da doença nas imagens. Alexander Selvikvåg Lundervold, da Universidade de Ciências Aplicadas da Noruega Ocidental, em Bergen, Noruega, especialista em machine learning e imagens médicas, diz que devemos esperar que a IA eventualmente possa ser capaz de detectar sinais da Covid-19 em pacientes. Mas não está claro se o caminho a percorrer são as tomografias. Por exemplo, os sinais físicos da doença podem não aparecer nas varreduras até algum tempo após a infecção, tornando-a pouco útil como diagnóstico precoce.
O Dr. Fan Zhongjie, especialista respiratório responsável por pacientes críticos com COVID-19 na província de Hubei, no centro da China, analisa uma imagem de tomografia computadorizada.
Além disso, como ainda temos poucos dados para treinar sistemas, é difícil avaliar a precisão dos estudos publicados online. A maioria dos sistemas de reconhecimento de imagens – incluindo aqueles treinados em imagens médicas – são adaptações de modelos treinados pela primeira vez no ImageNet, um conjunto de dados amplamente usado que abrange milhões de imagens diárias. “Classificar algo simples e parecido aos dados do ImageNet, como imagens de cães e gatos, pode ser feito com muitos poucos dados”, diz Lundervold. “Achados sutis em imagens médicas, nem tanto.”
Não quer dizer que isso não aconteça – e as ferramentas de IA podem ser construídas para detectar estágios iniciais da doença em futuros surtos. Mas, atualmente, deveríamos ser céticos sobre muitas das reivindicações dos médicos de IA que diagnosticam a Covid-19. Novamente, o compartilhamento de mais dados do paciente será útil, assim como as técnicas de machine learning que permitem que os modelos sejam treinados, mesmo quando há poucos dados disponíveis. Por exemplo, few-shot learning, onde uma IA pode aprender padrões com apenas alguns resultados, e transfer learning, quando uma IA já treinada para fazer uma coisa pode ser rapidamente adaptada para fazer algo semelhante, são avanços promissores – mas ainda em desenvolvimento.
A cura de tudo
Os dados também são essenciais se a IA ajudar a desenvolver tratamentos para a doença. Uma técnica para identificar possíveis candidatos a medicamentos é usar algoritmos de design generativo, que produzem um grande número de resultados em potencial. Em seguida, selecionam aqueles que precisariam ser analisados com mais atenção. Essa técnica pode ser usada para pesquisar rapidamente milhões de estruturas biológicas ou moleculares, por exemplo.
A SRI International está colaborando com essa ferramenta de IA, que usa deep learning para gerar muitos candidatos a novos medicamentos que os cientistas podem avaliar quanto à eficácia. Isso é um divisor de águas para a descoberta de remédios, mas ainda pode levar muitos meses até que um candidato promissor se torne um tratamento viável.
Em teoria, IAs também poderiam ser usadas para prever a evolução do coronavírus. Inam imagina a execução de algoritmos de aprendizado não supervisionados para simular todos os caminhos possíveis de evolução. Em seguida, poderiam ser adicionadas possíveis vacinas e ver se os vírus sofrem mutação para desenvolver resistência. “Isso permitirá que os virologistas estejam alguns passos à frente dos vírus e criem vacinas caso ocorra alguma dessas mutações catastróficas”, diz ele.
É uma possibilidade emocionante, mas distante. Ainda não temos informações suficientes sobre como o coronavírus sofre mutação para poder simulá-lo desta vez.
Enquanto isso, a barreira final poderiam ser os responsáveis políticos. “O que eu mais gostaria de mudar é o pensamento dos políticos sobre a IA”, diz Wang. A IA não será capaz de prever os surtos de doenças por si só, independentemente da quantidade de dados obtidos. Fazer com que os líderes do governo, empresas e assistência médica confiem nessas ferramentas mudará fundamentalmente a rapidez com a qual podemos reagir aos surtos de doenças, diz ele. Mas essa confiança precisa vir de uma visão realista do que a IA realmente é capaz de fazer agora – e o que pode torná-la melhor na próxima vez.
Para aproveitar ao máximo a IA, são necessários muitos dados, tempo e coordenação inteligente entre muitas pessoas diferentes. E tudo isso está em falta no momento.