Uma empresa de IA gera em laboratório 500 milhões de anos de evolução até encontrar uma proteína fluorescente artificial. Uma ‘startup’ criada por antigos pesquisadores da Meta cria um caminho evolutivo alternativo usando o maior poder de computação já utilizado na biologia, segundo a empresa.
Os cientistas se perguntam se a evolução poderia ter seguido um caminho diferente. Por exemplo, era inevitável o surgimento do ser humano, ou somos o resultado de uma série de coincidências naturais que poderiam não ter ocorrido, resultando em um mundo alternativo? Não há uma resposta definitiva, mas hoje a inteligência artificial (IA) pode realizar experimentos evolutivos. Um deles, publicado esta semana na revista Science, revela que, no design de um tipo de proteína, existiam outras rotas possíveis que a natureza não explorou. E essa tecnologia pode fornecer pistas valiosas para a criação de novas terapias e outras aplicações.
Em seu livro de 1989, A Vida Maravilhosa, o biólogo evolutivo Stephen Jay Gould propôs um experimento mental: se a fita da evolução da vida na Terra pudesse ser rebobinada para voltar ao início e começar de novo, o resultado seria o mesmo que conhecemos ou completamente diferente? Gould argumentava a favor da segunda hipótese: em uma nova rodada, usando a analogia dos videogames, a evolução teria seguido um caminho muito distinto e os humanos não existiriam. “Reproduza a fita um milhão de vezes… e duvido que algo como o Homo sapiens pudesse evoluir novamente”, escreveu.
A tese de Gould tem sido amplamente debatida desde então, com opiniões que favorecem o determinismo e outras que defendem a contingência. Em seu conto de 1952, O Som do Trovão, o escritor de ficção científica Ray Bradbury narrou como um viajante do tempo que pisava em uma borboleta na época dos dinossauros mudava o rumo do futuro. Gould expressava essa mesma ideia: “Altere qualquer evento inicial, mesmo que de forma muito sutil e sem aparente importância naquele momento, e a evolução seguirá por um caminho totalmente diferente”.
Falar a linguagem das proteínas
Os cientistas têm investigado essa questão por meio de experimentos que tentam recriar a evolução em laboratório ou na natureza, ou comparando espécies que surgiram em condições semelhantes. Hoje, existe um novo caminho: a IA. Em Nova York, um grupo de antigos pesquisadores da Meta — empresa-mãe das redes sociais Facebook, Instagram e WhatsApp — fundou a EvolutionaryScale, uma startup de IA focada em biologia. O sistema ESM3 (EvolutionaryScale Model 3), criado por essa empresa, é um modelo generativo de linguagem; um tipo de plataforma à qual pertence o famoso ChatGPT, mas o ESM3 não gera textos, e sim proteínas, os blocos fundamentais da vida.
O ESM3 é alimentado por dados de sequência, estrutura e função de proteínas existentes para aprender a linguagem biológica dessas moléculas e criar novas. Seus criadores o treinaram com 771 bilhões de pacotes de dados gerados a partir de 3,15 bilhões de sequências, 236 milhões de estruturas e 539 milhões de características funcionais, totalizando mais de um trilhão de teraflops (uma unidade de medida do desempenho computacional), representando o maior poder de computação já utilizado na biologia, segundo a própria empresa.
“ESM3 dá um passo em direção a um futuro da biologia, onde a IA é uma ferramenta para construir desde os primeiros princípios, da mesma forma que construímos estruturas, máquinas e microchips”, afirma Alexander Rives, cofundador e chefe científico da EvolutionaryScale, além de diretor do novo estudo. Sua visão é que a biologia é a tecnologia mais avançada já criada e que é programável, pois utiliza um alfabeto comum: o código genético, que se traduz em aminoácidos, os blocos de construção das proteínas. “O ESM3 entende todos esses dados biológicos, os traduz e os fala fluentemente para usá-los como ferramenta generativa.”
A proteína que não foi
Rives e seus colaboradores aplicaram o ESM3 ao problema de criar uma nova proteína fluorescente verde (Green Fluorescent Protein, GFP). A GFP é uma proteína natural que brilha em verde sob luz ultravioleta e é amplamente usada na pesquisa científica como marcador. A primeira foi descoberta em uma água-viva, mas outras versões existem em corais e anêmonas. Os cientistas treinaram o ESM3 para criar uma nova GFP, e o resultado os surpreendeu: uma proteína fluorescente, que chamaram de esmGFP, com apenas 58% de semelhança com a mais próxima conhecida — o que, segundo os pesquisadores, equivale a simular 500 milhões de anos de evolução. O ESM3 agora está disponível para a comunidade científica como uma nova ferramenta para o design de proteínas com funções terapêuticas, aplicações ambientais e outros usos.
Assim, a IA encontrou um novo caminho que a natureza poderia ter seguido há 500 milhões de anos, mas que, por razões desconhecidas, ignorou. Rives e seus colaboradores explicam que apenas algumas poucas mutações na GFP podem destruir sua fluorescência. No entanto, o ESM3 descobriu um novo espaço de proteínas fluorescentes que poderiam ter existido, mas não existiram: “Sob essas sequências existe uma linguagem fundamental da biologia das proteínas que pode ser compreendida usando modelos de linguagem”.
Segundo Jonathan Losos, professor da Universidade de Washington que estuda a questão do “rebobinar” da evolução observando espécies na natureza, “este estudo é um exemplo brilhante de que existem muitas maneiras pelas quais a evolução poderia ter ocorrido”. Losos considera os resultados do estudo como uma confirmação da contingência defendida por Gould. Essa visão também é compartilhada por Zachary Blount, professor da Universidade Estadual de Michigan, que demonstrou a contingência da evolução em um famoso experimento de cultivo de bactérias iniciado em 1988 por seu antigo supervisor, Richard Lenski, e que continua até hoje após mais de 80.000 gerações.
“O estudo mostra que há possibilidades biológicas viáveis que (acreditamos) não evoluíram na Terra, sugerindo caminhos genuínos que a evolução poderia ter tomado, mas não tomou porque a história necessária não aconteceu”, comenta Blount. No entanto, ele adverte que também existe um certo grau de determinismo na natureza; afinal, no experimento com o ESM3, ainda há 42% de semelhança com outras GFP. Blount não acredita que a IA vá resolver de vez a questão do “rebobinar” da evolução, mas reconhece que ajudará a entender o que é contingente, o que não é e por quê: “Ela nos fornece maneiras de explorar o espectro das possibilidades biológicas, permitindo-nos comparar o que é biologicamente possível com o que existe ou já existiu”.
Javier Yanes é um jornalista e escritor espanhol especializado em ciência e tecnologia. Ele escreve sobre temas como biologia, inteligência artificial, evolução e avanços científicos em geral. Seus artigos são frequentemente publicados em meios de comunicação reconhecidos, como El País. Além disso, também é autor de romances e ensaios.
0 Comments