Das Arc Institute hat in Zusammenarbeit mit NVIDIA und Forschern der Stanford University, der University of California, Berkeley und der University of California, San Francisco, Evo2 vorgestellt, das weltweit größte KI-Modell für Biologie. Das Modell wurde mit Daten von über 128.000 Genomen trainiert, umfassend 9,3 Billionen Nukleotide – vergleichbar mit den leistungsstärksten generativen KI-Sprachmodellen.

QQ_1740017835097.png

Evo2s Deep-Learning-Fähigkeiten ermöglichen die schnelle Identifizierung von Mustern in den Gensequenzen verschiedener Organismen, wodurch jahrelange Forschungsarbeit eingespart wird. Das Modell kann krankheitsverursachende Mutationen präzise identifizieren und neue Genome mit einer Größe vergleichbar mit einfachen bakteriellen Genomen designen. Das Evo2-Entwicklungsteam kündigte die Veröffentlichung detaillierter Informationen und einer benutzerfreundlichen Oberfläche namens Evo Designer am 19. Februar 2025 an. Der Code von Evo2 ist auf Arcs GitHub öffentlich zugänglich und in das BioNeMo-Framework von NVIDIA integriert, um den wissenschaftlichen Fortschritt zu fördern.

Im Vergleich zum Vorgängermodell Evo1 umfasst Evo2 eine größere Datenmenge, die Bakterien, Archaeen, Viren sowie eukaryotische Organismen wie Menschen und Pflanzen beinhaltet. Die Forscher betonen, dass die Entwicklung von Evo2 einen wichtigen Meilenstein im Bereich der generativen Biologie darstellt, da es Maschinen ermöglicht, die Sprache der Nukleotide zu „lesen, schreiben und verstehen“.

Technisch gesehen wurde Evo2 auf der NVIDIA DGX Cloud AI-Plattform mit über 2000 NVIDIA H100 GPUs trainiert. Das Modell kann Gensequenzen mit bis zu 1 Million Nukleotiden gleichzeitig verarbeiten und so die Beziehungen zwischen weit entfernten Teilen des Genoms verstehen. Die neue KI-Architektur „StripedHyena2“ ermöglicht Evo2 die Verarbeitung von 30-mal mehr Daten als Evo1.

Evo2 bietet ein breites Anwendungsspektrum, beispielsweise bei der Analyse genetischer Veränderungen im Zusammenhang mit Proteinfunktionen und der Anpassungsfähigkeit von Organismen. Bei Tests an Varianten des BRCA1-Gens, das mit Brustkrebs in Verbindung steht, lag die Genauigkeit der Mutationsvorhersage von Evo2 bei über 90 %. Diese Ergebnisse können Laborzeit und -kosten erheblich reduzieren und die Entwicklung neuer Medikamente vorantreiben.

Darüber hinaus kann Evo2 bei der Entwicklung neuer biologischer Werkzeuge oder Behandlungsmethoden helfen. Wissenschaftler könnten beispielsweise Gentherapien entwickeln, die auf spezifische Zellen abzielen und Nebenwirkungen vermeiden. Das Forschungsteam geht davon aus, dass auf der Grundlage von Evo2 spezifischere KI-Modelle entwickelt werden können, die weitere Möglichkeiten für die Genomforschung und die Biotechnik eröffnen.

In Bezug auf ethische und sicherheitsrelevante Aspekte stellen die Forscher sicher, dass der Evo2-Datensatz keine Krankheitserreger enthält, die für Menschen und andere komplexe Lebewesen schädlich sind, um diese Technologie verantwortungsvoll zu entwickeln und einzusetzen.

Evo2 detaillierte Informationen: https://arcinstitute.org/news/blog/evo2

Wichtigste Punkte:

🌱 Evo2 ist das weltweit größte KI-Modell für Biologie, trainiert mit Daten von 128.000 Genomen.

🔍 Das Modell kann schnell krankheitsverursachende Mutationen identifizieren und neue Genome designen, wodurch die Forschungseffizienz deutlich gesteigert wird.

💡 Evo2 eröffnet neue Möglichkeiten für die zukünftige Biotechnologie und das Design von Gentherapien.