Nos desertos da Austrália e da África do Sul, os astrônomos estão plantando florestas de detectores metálicos que, juntos, vasculharão o cosmos em busca de sinais de rádio. Quando começar a funcionar, em cerca de cinco anos, o Square Kilometer Array Observatory buscará novas informações sobre as primeiras estrelas do universo e os diferentes estágios da evolução galáctica.
Mas, depois de sincronizar centenas de milhares de pratos e antenas, os astrônomos enfrentarão rapidamente um novo desafio: examinar cerca de 300 petabytes de dados cosmológicos por ano – o suficiente para encher um milhão de laptops.
Esse é um problema que se repetirá em outros lugares, na próxima década. À medida que os astrônomos construírem câmeras gigantescas para obter imagens de todo o céu e lançarem telescópios infravermelhos para caçar planetas distantes, eles coletarão dados em escalas sem precedentes.
“Realmente não estamos preparados para isso, e todos nós deveríamos estar nos assustando”, diz Cecilia Garraffo, astrofísica computacional do Harvard-Smithsonian Center for Astrophysics. “Quando você tem dados demais e não tem a tecnologia para processá-los, é como se não tivesse dados.”
Para se preparar para o dilúvio de informações, os astrônomos estão recorrendo à IA para obter ajuda, otimizando algoritmos para identificar padrões em conjuntos de dados grandes e notoriamente complicados. Alguns estão agora trabalhando para estabelecer institutos dedicados a unir os campos da ciência da computação e da astronomia – e lutando com os termos da nova parceria.
Em novembro de 2022, Garraffo criou o AstroAI como um programa piloto no Centro de Astrofísica. Desde então, ela montou uma equipe interdisciplinar de mais de 50 membros que planejou dezenas de projetos com foco em questões profundas, como a maneira que o universo começou e se estamos sozinhos nele. Nos últimos anos, várias associações semelhantes seguiram o exemplo de Garraffo e agora estão competindo por financiamento para expandir para grandes instituições.
Garraffo reconheceu a potencial utilidade dos modelos de IA enquanto alternava de carreiras, entre astronomia, física e ciência da computação. Ao longo do caminho, ela também percebeu um grande obstáculo para os esforços de colaboração anteriores: a barreira do idioma. Muitas vezes, astrônomos e cientistas da computação têm dificuldades para unir forças porque usam palavras diferentes para descrever conceitos semelhantes. Garraffo não é alheia a problemas de tradução, pois, quando era criança, na Argentina, teve dificuldades para se virar em uma escola que só ensinava em inglês. Com base nessa experiência, ela tem trabalhado para colocar pessoas de ambas as comunidades sob o mesmo teto, para que possam identificar objetivos comuns e encontrar uma maneira de se comunicar.
Os astrônomos já vinham usando modelos de IA há anos, principalmente para classificar objetos conhecidos, como supernovas, em dados de telescópio. Esse tipo de reconhecimento de imagem se tornará cada vez mais vital quando o Observatório Vera C. Rubin abrir no próximo ano, e o número de detecções anuais de supernovas saltar rapidamente de centenas para milhões. Mas a nova onda de aplicações de IA vai muito além dos jogos de correspondência. Recentemente, os algoritmos foram otimizados para realizar “agrupamento não supervisionado”, no qual eles identificam padrões nos dados sem que lhes seja dito o que procurar especificamente. Isso abre as portas para modelos que indicam aos astrônomos efeitos e relações dos quais eles não estão cientes no momento. Pela primeira vez, essas ferramentas computacionais oferecem aos astrônomos a capacidade de “buscar sistematicamente o desconhecido”, diz Garraffo. Em janeiro, os pesquisadores da AstroAI usaram esse método para catalogar mais de 14.000 detecções de fontes de raios X, que, de outra forma, são difíceis de categorizar.
Outra maneira pela qual a IA se mostra útil é farejando a composição química dos céus de planetas alienígenas. Os astrônomos usam telescópios para analisar a luz das estrelas que passa pelas atmosferas dos planetas e é absorvida, em determinados comprimentos de onda, por diferentes moléculas. Para dar sentido ao espectro de luz restante, os astrônomos geralmente o comparam com espectros falsos que geram com base em moléculas que estão interessados em encontrar – como água e dióxido de carbono. Os pesquisadores de exoplanetas sonham em expandir sua busca para centenas ou milhares de compostos que poderiam indicar vida no planeta abaixo, mas atualmente são necessárias algumas semanas para procurar apenas quatro ou cinco compostos. Esse gargalo se tornará cada vez mais problemático à medida que o número de detecções de exoplanetas aumentar de dezenas para milhares, como se espera que aconteça graças ao recém-implantado Telescópio Espacial James Webb e ao Telescópio Espacial Ariel da Agência Espacial Europeia, com lançamento previsto para 2029.
O processamento de todas essas observações “levará uma eternidade”, diz Mercedes López-Morales, astrônoma do Centro de Astrofísica que estuda as atmosferas de exoplanetas. “Ferramentas como o AstroAI estão aparecendo no momento certo, pouco antes de essas torneiras de dados chegarem até nós.”
No ano passado, López-Morales se uniu a Mayeul Aubin, então estagiário de graduação na AstroAI, para criar um modelo de aprendizado de máquina que pudesse extrair com mais eficiência, a composição molecular de dados espectrais. Em dois meses, a equipe criou um modelo capaz de analisar milhares de espectros de exoplanetas, em busca das assinaturas de cinco moléculas diferentes em 31 segundos, uma façanha que lhes rendeu o prêmio principal no Ariel Data Challenge da Agência Espacial Europeia. Os pesquisadores esperam treinar um modelo para procurar centenas de moléculas adicionais, aumentando suas chances de encontrar sinais de vida em planetas distantes.
As colaborações da AstroAI também deram origem a simulações realistas de buracos negros e mapas de como a matéria escura está distribuída pelo universo. Garraffo pretende criar um grande modelo de linguagem semelhante ao ChatGPT, treinado com dados astronômicos e capaz de responder a perguntas sobre observações e analisar a literatura em busca de evidências de apoio.
“Há um novo e enorme playground a ser explorado”, diz Daniela Huppenkothen, astrônoma e cientista de dados do Instituto Holandês de Pesquisa Espacial. “Podemos usar [IA] para resolver problemas que não podíamos resolver antes, porque eram muito caros do ponto de vista computacional.”
No entanto, a incorporação da IA ao fluxo de trabalho da astronomia traz consigo sua própria série de compensações, como Huppenkothen descreveu em um texto acadêmico recente. Os modelos de IA, embora eficientes, geralmente operam de maneiras que os cientistas não compreendem totalmente. Essa obscuridade os torna complicados de limpar e difíceis de identificar como podem estar introduzindo vieses. Como todas as formas de IA generativa, esses modelos são propensos a criar relações que não existem e relatar suas conclusões com um ar de confiança infundada.
“É importante analisar criticamente o que esses modelos fazem e onde eles falham”, diz Huppenkothen. “Caso contrário, diremos algo sobre como o universo funciona e isso não poderá não ser verdade.”
Os pesquisadores estão trabalhando para incorporar barras de erro nas respostas dos algoritmos, para levar em conta as novas incertezas. Alguns sugerem que as ferramentas poderiam garantir uma camada adicional de verificação aos processos atuais de publicação e revisão por pares. “Como seres humanos, somos naturalmente inclinados a acreditar na máquina”, diz Viviana Acquaviva, astrofísica e cientista de dados da City University of New York, que recentemente publicou um livro sobre aplicações de aprendizado de máquina em astronomia. “Precisamos ser muito claros ao apresentar resultados que muitas vezes não são facilmente explicáveis e, ao mesmo tempo, ser muito honestos na forma como representamos as capacidades.”
Os pesquisadores estão cientes das ramificações éticas da introdução da IA, mesmo em um contexto aparentemente inofensivo, como a astronomia. Por exemplo, essas novas ferramentas de IA podem perpetuar as desigualdades existentes no campo, se apenas instituições selecionadas tiverem acesso aos recursos computacionais para executá-las. E se os astrônomos reciclarem os modelos de IA existentes que as empresas treinaram para outros fins, eles também “herdarão muitas das questões éticas e ambientais inerentes a esses modelos”, diz Huppenkothen.
Garraffo está trabalhando para estar há um passo à frente dessas preocupações. Os modelos da AstroAI são todos de código aberto e estão disponíveis gratuitamente, e o grupo se oferece para ajudar a adaptá-los a diferentes aplicações astronômicas. Ela também fez uma parceria com o Berkman Klein Center for Internet & Society de Harvard para treinar formalmente a equipe em ética de IA e aprender as práticas recomendadas para evitar preconceitos.
Os cientistas ainda estão analisando todas as maneiras pelas quais a chegada da IA pode afetar o campo da astronomia. Se os modelos de IA conseguirem apresentar ideias fundamentalmente novas e direcionar os cientistas para novos caminhos de estudo, isso mudará para sempre o papel do astrônomo na descoberta do universo. Mas, mesmo que continue sendo apenas uma ferramenta de otimização, a IA está pronta para se tornar um dos pilares do arsenal de pesquisas cósmicas.
“Ela vai mudar o jogo”, diz Garraffo. “Não podemos mais fazer isso sozinhos.”
Sobre o autor
Por Zack Savitsky. Zack é repórter freelancer na MIT Techonology Review, que cobre assuntos ligados à física e astronomia.