Salta al contenuto

Il più grande modello di biologia AI di sempre scrive DNA su richiesta

Il modello si chiama EVO-2, è open source e dietro c'è anche Nvidia.

In breve

Può scrivere cromosomi e genomi da zero ed è stato addestrato su 128.000 genomi. È già stato utilizzato con successo per prevedere mutazioni in un gene associato al cancro al seno.

Riassunto completo

  • Un nuovo modello di intelligenza artificiale, chiamato Evo-2, è stato rilasciato, il più grande nella biologia, in grado di scrivere cromosomi interi e piccoli genomi da zero.
  • Evo-2, sviluppato dall'Arc Institute, Stanford University e Nvidia, è stato addestrato su 128.000 genomi, comprendendo organismi complessi come umani, animali, piante e organismi eucariotici.
  • Evo-2 è accessibile ai ricercatori tramite interfacce web e offre il codice e i dati per replicarlo liberamente.
  • Rispetto ai modelli precedenti, Evo-2 può comprendere il DNA non codificante, utile nell'interpretazione di varianti genetiche difficili legate a malattie.

Che cos'è il DNA non codificante?

Il DNA non codificante è quella parte del DNA che non contiene istruzioni per produrre proteine. Per molto tempo è stato considerato "DNA spazzatura" perché non sembrava avere una funzione chiara, ma oggi sappiamo che gioca un ruolo fondamentale nella regolazione dell'attività dei geni. Questo DNA può contenere elementi regolatori, come promotori e enhancers, che controllano quando e dove i geni vengono attivati o disattivati. È importante nello studio delle malattie genetiche perché molte mutazioni che influenzano il rischio di malattie non si trovano nei geni stessi, ma nel DNA non codificante che ne regola l'espressione.

  • I ricercatori hanno utilizzato Evo-2 per analizzare mutazioni nel gene BRCA1, associato al cancro al seno, dimostrando un'elevata precisione nell'identificare mutazioni a rischio.

Questo testo è un riassunto del seguente articolo (eng):

Biggest-ever AI biology model writes DNA on demand
An artificial-intelligence network trained on a vast trove of sequence data is a step towards designing completely new genomes.

Alternativa in italiano: non pervenuta

Commenti

Più recenti