Desde que o agente geral de IA Manus foi lançado no início de março, ele se espalhou pela internet como fogo. E não apenas na China, onde foi desenvolvido pela startup Butterfly Effect, sediada em Wuhan. Ele entrou na conversa global, com vozes influentes da tecnologia, incluindo o cofundador do Twitter Jack Dorsey e o líder de produto da Hugging Face, Victor Mustar, elogiando seu desempenho. Alguns chegaram a chamá-lo de “o segundo DeepSeek”, comparando-o ao modelo de IA anterior que surpreendeu a indústria tanto por suas capacidades inesperadas quanto por sua origem.
O Manus afirma ser o primeiro agente geral de IA do mundo, utilizando múltiplos modelos de IA (como o Claude 3.5 Sonnet da Anthropic e versões ajustadas do Qwen de código aberto da Alibaba) e vários agentes operando de forma independente para agir autonomamente em uma ampla variedade de tarefas. (Isso o torna diferente de chatbots de IA, como o DeepSeek, que se baseiam em uma única família de modelos de linguagem e são projetados principalmente para interações conversacionais.)
Apesar de toda a empolgação, poucas pessoas tiveram a chance de usá-lo. Atualmente, menos de 1% dos usuários na lista de espera receberam um código de convite. (Não está claro quantas pessoas estão nessa lista, mas, para se ter uma ideia do interesse, o canal do Manus no Discord tem mais de 186.000 membros.)
A MIT Technology Review conseguiu acesso ao Manus e, ao testá-lo, senti que usá-lo era como colaborar com um estagiário altamente inteligente e eficiente: embora ocasionalmente não entenda o que está sendo solicitado, faça suposições incorretas ou tome atalhos para agilizar tarefas, ele explica claramente seu raciocínio, é notavelmente adaptável e pode melhorar substancialmente quando recebe instruções ou feedback detalhados. Em resumo, é promissor, mas não perfeito.
Assim como o produto anterior da empresa-mãe — um assistente de IA chamado Monica lançado em 2023 — o Manus é voltado para um público global. O inglês é definido como idioma padrão, e seu design é limpo e minimalista.
Para entrar, o usuário precisa inserir um código de convite válido. Em seguida, o sistema direciona os usuários para uma página inicial muito semelhante às do ChatGPT ou DeepSeek, com sessões anteriores exibidas em uma coluna à esquerda e uma caixa de entrada de chat no centro. A página inicial também apresenta tarefas de exemplo organizadas pela empresa — que vão desde desenvolvimento de estratégias de negócios até aprendizado interativo e sessões de meditação personalizadas em áudio.
Como outras ferramentas de IA agentiva baseadas em raciocínio, como o ChatGPT DeepResearch, o Manus é capaz de dividir tarefas em etapas e navegar autonomamente pela web para obter as informações necessárias para completá-las. O que o diferencia é a janela chamada “Computador do Manus”, que permite aos usuários não apenas observar o que o agente está fazendo, mas também intervir a qualquer momento.
Para testá-lo, dei ao Manus três tarefas: (1) compilar uma lista de jornalistas relevantes que cobrem tecnologia na China, (2) buscar imóveis de dois quartos em Nova York, e (3) indicar possíveis candidatos para o prêmio Innovators Under 35, da MIT Technology Review.
Veja como ele se saiu:
Tarefa 1: A primeira lista de jornalistas entregue pelo Manus continha apenas cinco nomes, com cinco “menções honrosas” abaixo deles. Notei que ele listava trabalhos notáveis de alguns jornalistas, mas não de outros. Perguntei ao Manus o motivo. A resposta foi hilariante de tão simples: ele ficou com preguiça. Foi “em parte devido a restrições de tempo enquanto eu tentava acelerar o processo de pesquisa”, disse o agente. Quando exigi consistência e profundidade, o Manus respondeu com uma lista abrangente de 30 jornalistas, informando o veículo atual e mencionando trabalhos relevantes. (Fiquei feliz em ver meu nome incluído, junto com muitos colegas estimados.)
Fiquei impressionado com o fato de poder sugerir mudanças de alto nível, como se estivesse lidando com um estagiário ou assistente real, e ele responder de forma apropriada. E embora inicialmente tenha deixado passar alterações no veículo de alguns jornalistas, ao pedir uma revisão dos resultados, ele corrigiu rapidamente. Outro recurso útil: o resultado pôde ser baixado em formato Word ou Excel, facilitando a edição ou o compartilhamento com outras pessoas.
O Manus, no entanto, teve dificuldades ao acessar artigos jornalísticos protegidos por paywalls; frequentemente esbarrava em captchas. Como pude acompanhar cada passo, consegui intervir para resolver essas barreiras, embora muitos sites ainda tenham bloqueado a ferramenta, alegando atividade suspeita. Vejo um grande potencial de melhoria nesse ponto — e seria útil se uma futura versão do Manus pudesse pedir ajuda proativamente ao encontrar esse tipo de restrição.
Tarefa 2: Para a busca por apartamentos, forneci ao Manus um conjunto complexo de critérios, incluindo orçamento e várias exigências: uma cozinha espaçosa, área externa, acesso a Manhattan e uma estação de trem principal a até sete minutos a pé. O Manus interpretou inicialmente exigências vagas, como “algum tipo de área externa”, de forma muito literal, excluindo completamente propriedades sem terraço privativo ou acesso à varanda. No entanto, após mais orientações e esclarecimentos, conseguiu compilar uma lista mais ampla e útil, com recomendações em categorias e marcadores organizados.
O resultado final parecia algo tirado do Wirecutter, com subtítulos como “melhor opção geral”, “melhor custo-benefício” e “opção de luxo”. Essa tarefa (incluindo os ajustes) levou menos de meia hora — bem menos tempo que a tarefa dos jornalistas (que levou pouco mais de uma hora), provavelmente porque os anúncios de imóveis são mais acessíveis e bem estruturados na internet.
Tarefa 3: Esta foi a mais abrangente: pedi ao Manus que indicasse 50 pessoas para a lista anual Innovators Under 35. Produzir essa lista é uma tarefa enorme, e normalmente recebemos centenas de indicações por ano. Estava curioso para ver como o Manus se sairia. Ele dividiu a tarefa em etapas, incluindo a análise de listas anteriores para entender os critérios de seleção, a criação de uma estratégia de busca para identificar candidatos, a compilação de nomes e a garantia de uma seleção diversa de candidatos de todo o mundo.
Desenvolver uma estratégia de busca foi a parte mais demorada para o Manus. Embora ele não tenha detalhado explicitamente sua abordagem, a janela “Computador do Manus” revelou o agente navegando rapidamente por sites de universidades de pesquisa prestigiadas, anúncios de prêmios tecnológicos e artigos de notícias. Mais uma vez, ele encontrou obstáculos ao tentar acessar artigos acadêmicos e conteúdo protegido por paywalls.
Após três horas vasculhando a internet — durante as quais o Manus (com razão) me perguntou várias vezes se eu poderia restringir a busca — ele conseguiu apresentar apenas três candidatos com perfis completos. Quando insisti novamente para que fornecesse uma lista completa com 50 nomes, ele acabou gerando uma, mas certas instituições acadêmicas e áreas estavam excessivamente representadas, refletindo um processo de pesquisa incompleto. Depois que apontei o problema e pedi que encontrasse cinco candidatos da China, ele conseguiu compilar uma lista sólida com cinco nomes, embora os resultados estivessem inclinados para figuras populares da mídia chinesa. No fim, tive que desistir depois que o sistema alertou que o desempenho do Manus poderia piorar caso eu continuasse inserindo muito texto.
Minha avaliação: de modo geral, achei o Manus uma ferramenta altamente intuitiva, adequada para usuários com ou sem experiência em programação. Em duas das três tarefas, ele apresentou resultados melhores do que o ChatGPT DeepResearch, embora tenha demorado significativamente mais para concluí-las. O Manus parece mais adequado para tarefas analíticas que exigem ampla pesquisa na internet aberta, mas com escopo limitado. Em outras palavras, funciona melhor para o tipo de coisa que um estagiário humano habilidoso poderia fazer ao longo de um dia de trabalho.
Ainda assim, nem tudo é tranquilo. O Manus pode sofrer com travamentos frequentes e instabilidade no sistema, e pode ter dificuldades ao processar grandes volumes de texto. A mensagem “Devido à alta carga de serviço no momento, não é possível criar tarefas. Por favor, tente novamente em alguns minutos” apareceu na minha tela algumas vezes quando tentei iniciar novas solicitações, e ocasionalmente o Computador do Manus travava em uma determinada página por um longo tempo.
Ele apresenta uma taxa de falhas mais alta do que o ChatGPT DeepResearch — um problema que a equipe está tentando resolver, segundo o cientista-chefe do Manus, Peak Ji. Dito isso, o veículo de mídia chinês 36Kr informa que o custo por tarefa do Manus é de cerca de US$ 2, o que representa apenas um décimo do custo do DeepResearch. Se a equipe do Manus reforçar sua infraestrutura de servidores, consigo ver a ferramenta se tornando a escolha preferida para usuários individuais, especialmente profissionais de colarinho branco, desenvolvedores independentes e pequenas equipes.
Por fim, considero realmente valioso o fato de que o processo de trabalho do Manus parece relativamente transparente e colaborativo. Ele faz perguntas ativamente ao longo do caminho e retém instruções-chave como “conhecimento” em sua memória para uso futuro, permitindo uma experiência agentiva facilmente personalizável. Também é muito positivo que cada sessão possa ser reproduzida e compartilhada.
Espero continuar usando o Manus para os mais diversos tipos de tarefas, tanto na vida pessoal quanto profissional. Embora eu não tenha certeza se as comparações com o DeepSeek sejam totalmente justas, ele serve como mais uma evidência de que as empresas chinesas de IA não estão apenas seguindo os passos de suas contrapartes ocidentais. Em vez de apenas inovar sobre modelos base, elas estão moldando ativamente a adoção de agentes autônomos de IA à sua maneira.