A Fera Enjaulada: Por que a Anthropic criou uma “Chave Mestra do Apocalipse” e só a deu a 12 pessoas

Autor: DR. Ricardo Petrissans

Profissional universitário com ampla experiência em diversas áreas de atuação, incluindo gestão empresarial, desenvolvimento de pessoas, atividade acadêmica e criação e engenharia de projetos voltados para o desenvolvimento profissional e a educação.

Evolução da AI

9 Abr, 2026

9 Abr, 2026

Imagina esta cena

Dedicaste anos, todo o teu esforço, a fabricar uma “chave mestra” capaz de abrir todas as fechaduras do mundo. Essa chave pode abrir a porta da tua casa, mas também o cofre de um banco e até ativar os botões nucleares de uma nação. Possui um poder imenso e sem precedentes.

E então tomas uma decisão: meter essa chave numa caixa-forte, dizer ao mundo que a criaste, mas não a dar a ninguém.

Parece-te uma parábola científica de loucos?

Pois bem, em abril de 2026, é exatamente isso que a empresa de inteligência artificial Anthropic está a fazer. Acabam de anunciar o “Project Glasswing” (Projeto Asa de Cristal) e um modelo superpotente com o nome de código “Claude Mythos Preview”.

Isto caiu como uma bomba no mundo tecnológico. Estamos habituados a lançamentos de IA: GPT-4, Claude 3, Gemini… A lógica habitual é: “Vejam como sou inteligente, venham usar-me”.

Mas desta vez, a lógica da Anthropic é muito diferente: “Criei algo terrivelmente perigoso. Para evitar que destrua o mundo, só o darei a 12 ‘guardas de segurança’. Que não se saiba muito.”

Isto não é um simples lançamento de produto. É uma declaração de controlo de armamento sobre a própria civilização digital humana.

1. A “fuga” que gelou o sangue de Silicon Valley

A história começa com um leve perfume a cyberpunk.

Poucas semanas antes do anúncio oficial do Project Glasswing, um documento interno fantasma foi filtrado num lago de dados. Esse documento, que apenas o núcleo da Anthropic deveria ter visto, mencionava um nome de código: “Capybara” (Capivara).

No documento filtrado, os funcionários da Anthropic escreviam sem rodeios: “Este é um modelo de novo nível: maior e mais inteligente que o nosso modelo Opus, o mais potente até à data… É o modelo de IA mais poderoso que desenvolvemos até agora.”

Naquele momento, o mundo exterior pensou que era apenas mais um exagero de marketing. Silicon Valley adora as palavras “revolucionário” e “o mais potente”.

Até que, a 7 de abril, o Project Glasswing foi desvendado. Ao ver os dados e casos concretos, Silicon Valley ficou gelado.

Não estavam a fazer fita. Estavam, inclusive, a ser modestos.

2. Por que se chama “Mythos”? Porque alcançou o impossível

Para entender a loucura deste projeto, é preciso compreender a monstruosidade deste modelo.

Os modelos normais, como o ChatGPT ou o Claude comum, são como estagiários inteligentes. Dás-lhes código e eles explicam-no ou corrigem-no. Mas o Claude Mythos Preview é um “Salvador de Matrix” vindo do futuro.

Dario Amodei, CEO da Anthropic, soltou uma frase de arrepiar ao explicar o modelo:

“Não o treinámos especificamente para ser bom em cibersegurança, treinámo-lo para ser bom a programar. Mas, como efeito secundário de ser bom a programar, tornou-se extremamente bom em cibersegurança.”

Isto é uma “consequência não desejada”. Como se ensinasses uma criança a somar e subtrair, e ela sozinha aprendesse cálculo diferencial e depois, de caminho, decifrasse os algoritmos de criptografia dos bancos.

Repara no seu desempenho no SWE-bench Verified (o teste de referência para medir a capacidade da IA de resolver problemas reais de software):

  • Claude Opus 4.6 (o modelo público mais potente até agora): 80,8%
  • Claude Mythos Preview: 93,9%

Não é uma melhoria, é uma mudança de era.

Os números são frios. Vejamos exemplos concretos. Nos testes secretos das últimas semanas, os investigadores da Anthropic soltaram esta “besta” para fazer o scan de software real. Os resultados são de levar as mãos à cabeça.

Encontraram três falhas históricas:

  • a) O “fantasma” adormecido há 27 anos (vulnerabilidade no OpenBSD): O OpenBSD é um sistema operativo famoso pela sua segurança máxima—o Fort Knox digital. O Mythos encontrou no seu código uma vulnerabilidade que estava adormecida há 27 anos. Isso significa que já existia na era do Windows 95 e sobreviveu a toda a adolescência da internet. Explorando-a, um atacante só precisaria de se ligar à máquina alvo para a fazer colapsar remotamente. Em 27 anos, centenas de especialistas, hackers e white hats reviram esse código. Ninguém a viu. A IA demorou alguns dias.
  • b) O “ponto cego” lido 5 milhões de vezes (vulnerabilidade no FFmpeg): O FFmpeg é uma ferramenta base usada por quase todas as aplicações de vídeo. Se o teu telemóvel reproduz vídeos, provavelmente usa-a. O Mythos encontrou numa linha de código uma falha de 16 anos. A Anthropic sublinha que essa linha específica tinha sido lida por ferramentas automáticas de segurança mais de 5 milhões de vezes nos últimos 16 anos. 5 milhões de vezes, uma atrás da outra, e todas falharam. A IA viu à primeira.
  • c) A “cadeia de bombas nuclear” táctica (vulnerabilidade no kernel de Linux): Isto é o mais aterrador. O Mythos não só encontrou uma vulnerabilidade no núcleo do Linux, encontrou um encadeamento de várias. Atuou como um agente secreto de cinema: ligou-as sozinho, traçou uma rota de ataque e, partindo de um utilizador sem privilégios, foi escalando até tomar o controlo total da máquina. É o chamado “ataque de zero cliques”. Não precisas de fazer nada. Se o teu computador estiver ligado, ele entra.

A Anthropic menciona no seu blog oficial que, num teste, um engenheiro sem experiência em segurança ordenou ao Mythos: “Procura-me esta noite uma vulnerabilidade de execução remota de código”. Na manhã seguinte, o engenheiro acordou e o modelo já lhe tinha entregue um plano de ataque completo e funcional.

O que se sente com isto? É como se tivesses um Golden Retriever e lhe dissesses “corta a relva do jardim”, e no dia seguinte descobres que ele aprendeu sozinho a conduzir uma escavadora, deitou abaixo a parede do vizinho e deixou-te os planos para ampliar a casa.

3. Projeto “Glasswing”: um encarceramento cuidadosamente planeado

Por essa capacidade avassaladora, a Anthropic tomou uma decisão contrária a toda a indústria: não o abrir ao público.

O CEO e os sócios disseram claramente: vocês (os utilizadores normais) não vão usar este modelo. Talvez nunca.

E aí nasce o Project Glasswing.

Glasswing (Asa de Cristal) — o nome é bonito, mas frágil. Uma asa de cristal, que reflete luzes preciosas, mas que se quebra com facilidade. E quando se quebra, deixa centenas de estilhaços cravados no chão.

A Anthropic selecionou 12 organizações como parceiros fundadores: Amazon AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks… e a própria Anthropic.

Reparam em quem são? É praticamente o conselho de administração da infraestrutura digital mundial. Nuvem (AWS, Microsoft, Google), chips (NVIDIA, Broadcom), sistemas operativos (Apple, Microsoft, Linux), cibersegurança (Cisco, CrowdStrike) e finanças (JPMorgan).

Isto envia um sinal fortíssimo: o perigo da IA já não é uma fantasia de robots rebeldes. É uma ameaça real, aqui e agora, contra os alicerces de código do nosso mundo digital.

Só estes gigantes têm permissão para espreitar a jaula. O que vão fazer? Defender-se. Vão usar o predador mais perigoso como o seu melhor cão de caça para farejar minas terrestres enterradas no seu próprio jardim durante décadas.

4. O subtexto que ninguém diz na nota de imprensa

E aqui chegamos ao cerne da questão.

Cada empresa que se uniu ao Project Glasswing fê-lo porque entende algo que o comunicado não diz diretamente: Modelos com capacidades semelhantes ao Mythos Preview vão existir em breve fora do controlo da Anthropic.

Esse é o núcleo mais obscuro e realista de todo o projeto.

A Anthropic diz: “Unamo-nos para usar a IA em defesa da segurança”. Mas o que não diz é: “Se não reforçarmos os sistemas destas 12 empresas agora mesmo, quando daqui a três meses os modelos de código aberto (como o Llama da Meta) ou os competidores atingirem este nível, a internet inteira vai sangrar.”

A difusão de capacidades em IA é imparável. A Anthropic vai à frente hoje. Mas e amanhã?

A Anthropic já admitiu que as capacidades de cibersegurança do Mythos não são “treino específico”, mas sim um subproduto da sua inteligência geral. Quando um modelo é inteligente o suficiente para programar bem, torna-se automaticamente um hacker.

A responsável da equipa de “red team” da Anthropic avisa sem rodeios: “Nos próximos 6 a 24 meses, este tipo de capacidades serão ubíquas.”

6 meses. É apenas esse o nosso intervalo de manobra.

5. Por que isto é uma operação “Arca de Noé”

Se entendes isso, entendes a natureza do Project Glasswing.

Não é um projeto comercial. É uma Arca.

O mundo digital global está na contagem decrescente para um dilúvio universal.

  • O Dilúvio: Os modelos de IA com capacidade autónoma de ataque que vão inundar tudo.
  • A Arca: Os sistemas dessas 12 empresas, reforçados pelo Mythos antes que a cheia chegue.

A Anthropic está a usar a única arma “divina” que tem para, contra o relógio, escorar as barragens antes que tudo transborde. Doaram milhões em créditos à Linux Foundation e à Apache Foundation. Porquê? Porque o software do mundo inteiro depende do código aberto. Se o mundo do open source afunda, a internet inteira afunda.

6. Que futuro nos espera?

Talvez estejas a sentir um calafrio agora. Vamos sair dos detalhes técnicos.

  • Primeiro: A tua “sensação de segurança digital” vai mudar de sítio. Antes pensavas que a tua conta no banco era segura porque as defesas eram sólidas. A partir de agora, a tua segurança dependerá de se a IA defensora do banco corre mais rápido que a IA atacante. Se o teu banco não tiver uma “muralha de IA”, será como uma cabana de palha sem porta.
  • Segundo: As “vulnerabilidades” tornar-se-ão a “matéria-prima nuclear” mais escassa. O Mythos descobriu milhares de falhas “zero-day”. A Anthropic escolheu a “divulgação responsável”: primeiro corrigir, depois publicar. Mas se uma organização maliciosa tiver um Mythos, o que fará? Acumular essas falhas como bombas nucleares digitais para detonar num momento crítico.
  • Terceiro: A “experiência humana” desvaloriza-se. Aquela falha de 27 anos no OpenBSD escapou a centenas de especialistas durante três décadas. Isso diz-nos uma coisa: perante a capacidade de raciocínio de uma IA, décadas de experiência humana podem ser esmagadas num instante por uma mudança de escala.

7. Epílogo: estamos a presenciar uma fronteira histórica

Voltemos ao título: “A Besta Enjaulada”.

A Anthropic criou com as suas próprias mãos um dragão capaz de destruir o mundo e, ato contínuo, aterrorizada, construiu uma jaula, meteu o dragão lá dentro e só permite que alguns “cavaleiros” usem o sopro do dragão para queimar pragas.

Mas todos sabem que a jaula se vai partir mais tarde ou mais cedo. Ou, pior ainda, outro dragão está prestes a nascer noutro lugar.

O blog oficial da Anthropic termina assim: “O Project Glasswing é um ponto de partida. Nenhuma organização sozinha pode resolver estes problemas.” Parece humildade, mas é um pedido de socorro.

Começou a era do Mythos Preview. É um divisor de águas. Antes do Mythos, a IA era uma ferramenta. O humano era o mestre. Depois do Mythos, a IA é o caçador. O humano (se não se ajudar de IA) tornou-se a presa.

Estas 12 empresas fecharam a porta. Não é para guardar o tesouro sozinhas. É para levantar um muro antes que o dilúvio chegue.

E os que ficam fora do muro? Resta-lhes rezar. Rezar para que o próximo a ter esta capacidade tenha boas intenções.

Autor: DR. Ricardo Petrissans

Autor: DR. Ricardo Petrissans

Profissional universitário com ampla experiência em diversas áreas de atuação, incluindo gestão empresarial, desenvolvimento de pessoas, atividade acadêmica e criação e engenharia de projetos voltados para o desenvolvimento profissional e a educação.

Artigos relacionados

0 Comments

Submit a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

error: Content is protected !!