Die neue KI von DeepMind kann genetische Krankheiten vorhersagen


Ungefähr 10 Jahre Vor Žiga Avsec war ein Doktorand der Physik, der über ein Universitätsmodul über maschinelles Lernen einen Crashkurs in Genomik belegte. Bald arbeitete er in einem Labor, das seltene Krankheiten untersuchte, an einem Projekt, das darauf abzielte, die genaue genetische Mutation zu bestimmen, die eine ungewöhnliche mitochondriale Erkrankung verursachte.

Laut Avsec handelte es sich hierbei um ein „Nadel im Heuhaufen“-Problem. Im genetischen Code lauerten Millionen potenzieller Schuldiger – DNA-Mutationen, die verheerende Auswirkungen auf die Biologie eines Menschen haben könnten. Von besonderem Interesse waren sogenannte Missense-Varianten: Änderungen des genetischen Codes um einen Buchstaben, die dazu führen, dass in einem Protein eine andere Aminosäure gebildet wird. Aminosäuren sind die Bausteine ​​von Proteinen, und Proteine ​​sind die Bausteine ​​von allem anderen im Körper, sodass selbst kleine Veränderungen große und weitreichende Auswirkungen haben können.

Es gibt 71 Millionen mögliche Missense-Varianten im menschlichen Genom, und der durchschnittliche Mensch trägt mehr als 9.000 davon. Die meisten sind harmlos, aber einige werden mit genetischen Krankheiten wie Sichelzellenanämie und Mukoviszidose sowie mit komplexeren Erkrankungen wie Typ-2-Diabetes in Verbindung gebracht, die durch eine Kombination kleiner genetischer Veränderungen verursacht werden können. Avsec begann seine Kollegen zu fragen: „Woher wissen wir, welche tatsächlich gefährlich sind?“ Die Antwort: „Na ja, im Großen und Ganzen tun wir das nicht.“

Von den 4 Millionen Missense-Varianten, die beim Menschen entdeckt wurden, wurden durch jahrelange sorgfältige und teure Forschung nur 2 Prozent als entweder pathogen oder gutartig eingestuft. Es kann Monate dauern, die Wirkung einer einzelnen Missense-Variante zu untersuchen.

Heute hat Google DeepMind, bei dem Avsec jetzt als Forschungswissenschaftler angestellt ist, ein Tool veröffentlicht, das diesen Prozess schnell beschleunigen kann. AlphaMissense ist ein maschinelles Lernmodell, das Missense-Varianten analysieren und die Wahrscheinlichkeit, dass sie eine Krankheit verursachen, mit einer Genauigkeit von 90 Prozent vorhersagen kann – besser als bestehende Tools.

Es ist darauf aufgebaut AlphaFold, das bahnbrechende Modell von DeepMind, das die Strukturen von Hunderten Millionen Proteinen anhand ihrer Aminosäurezusammensetzung vorhersagte, aber es funktioniert nicht auf die gleiche Weise. Anstatt Vorhersagen über die Struktur eines Proteins zu treffen, funktioniert AlphaMissense eher wie ein großes Sprachmodell wie ChatGPT von OpenAI.

Es wurde in der Sprache der menschlichen (und Primaten-)Biologie geschult und weiß daher, wie normale Aminosäuresequenzen in Proteinen aussehen sollten. Wenn ihm eine fehlerhafte Reihenfolge präsentiert wird, kann er dies zur Kenntnis nehmen, beispielsweise bei einem unpassenden Wort in einem Satz. „Es ist ein Sprachmodell, aber auf Proteinsequenzen trainiert“, sagt Jun Cheng, der zusammen mit Avsec Co-Hauptautor eines veröffentlichten Artikels ist Heute In Wissenschaft das der Welt AlphaMissense ankündigt. „Wenn wir ein Wort aus einem englischen Satz ersetzen, kann eine Person, die mit Englisch vertraut ist, sofort erkennen, ob diese Ersetzungen die Bedeutung des Satzes ändern oder nicht.“

Pushmeet Kohli, Vizepräsident für Forschung bei DeepMind, verwendet die Analogie eines Rezeptbuchs. Wenn es bei AlphaFold genau darum ging, wie sich Zutaten verbinden könnten, sagt AlphaMissense voraus, was passieren könnte, wenn Sie die völlig falsche Zutat verwenden.

source-114

Leave a Reply