Nächster Schritt bei der Lösung des Lp(a)-Rätsels
Mit der Kombination von Nanopore Sequencing und einem bioinformatischen UMI-Fehlerkorrekturmodell, hat es ein Team um Stephan Amstler und Stefan Coassin vom Institut für Genetische Epidemiologie geschafft, eine „dunkle Genregion“ im LPA Gen nahezu exakt zu sequenzieren, Mutationen zu identifizieren und deren Reihenfolge zu bestimmen. Die Studie trägt zur Klärung der unterschiedlich hohen Lp(a)-Spiegel in der Bevölkerung bei und wurde im angesehenen Fachjournal Genome Medicine veröffentlicht.
Seit vielen Jahren forschen WissenschafterInnen unter der Leitung von Florian Kronenberg am Institut für Genetische Epidemiologie an der Medizinischen Universität Innsbruck intensiv rund um das Lipoprotein(a) – kurz: Lp(a) – und das dazugehörige Gen LPA. Bei Lp(a) handelt es sich um ein Plasmapartikel, genau gesagt um ein LDL-Partikel, an das ein Apolipoprotein-A Molekül gekoppelt ist. Lp(a) wird fast ausschließlich genetisch reguliert und gilt mittlerweile als der am stärksten genetisch bedingte Risikofaktor für Herz-Kreislauf-Erkrankungen, wie Herzinfarkt, Aortenstenose, Herzversagen, Schlaganfall und periphere arterielle Verschlusskrankheit. Je höher die Lp(a)-Konzentration im Blut, desto höher das Risiko, wobei die Grenze bei 30 mg/dl liegt.
„Das Spannende am Lp(a) ist, dass es Menschen gibt, die beinahe null davon haben und es gibt welche mit bis zu 700 oder 800 mg/dl. Zudem sehen wir global und auch innerhalb Europas große Unterschiede in den verschiedenen Populationen. Die Hälfte der mitteleuropäischen Bevölkerung liegt bei ca. 15 mg/dl oder darunter, die andere Hälfte bereits darüber. Südeuropäer weisen beispielsweise im Schnitt eine doppelt so hohe Konzentration auf als Nordeuropäer. Der Median in afrikanischen Populationen beträgt sogar bis zu 50 mg/dl, in chinesischen Populationen hingehen liegt er bei nur etwa fünf Milligramm pro Deziliter Blutplasma. Die Unterschiede sind extrem. Es ist daher wichtig, die Genetik von Lp(a) vollständig aufzuklären“, sagt Stefan Coassin, Seniorautor der unlängst im renommierten Fachjournal Genome Medicine veröffentlichten Studie „Nanopore sequencing with unique molecular identifiers enables accurate mutation analysis and haplotyping in the complex lipoprotein(a) KIV-2 VNTR“.
Veranstaltungshinweis: Wissen/schaf(f)t Gesundheit Vortrag von Florian Kronenberg: Lp(a) – ein häufiger Risikofaktor für Herzinfarkt & Co." am 22. Jänner 2025, 18:30 Uhr im Audimax der Med Uni Innsbruck und im Livestream. Alle Infos gibt es hier
Risiko versteckt sich in Dark Regions
Denn bisher können nicht alle Informationen des LPA-Gens eingesehen und interpretiert werden. Ein Teil des Gens besteht aus einer so genannten Dark Genome Region namens KIV-2 VNTR, die mit herkömmlichen Sequenziermethoden nur zum Teil gelesen bzw. noch nicht korrekt angeordnet werden kann. „Diese Region ist Copy Number variabel. Das bedeutet, dass sich dort ganz unterschiedlich viele Kopien derselben Region davon verbergen können, die bis zu 70 Prozent des gesamten Gens ausmachen können. Was wir wissen ist, dass KIV-2 VNTR den Lp(a)-Spiegel mitbestimmt. Grundsätzlich kann man davon ausgehen, dass eine hohe Kopienzahl, eine eher niedrige Lp(a)-Konzentration zur Folge hat. Umgekehrt haben Menschen mit wenigen Kopien einen fünf- bis zehnmal höheren Lp(a)-Spiegel. Das trifft aber nur im großen Maßstab zu. Wenn man die Individuen einzeln anschaut, gibt es immer welche, die bei gleicher Kopienanzahl sehr stark unterschiedliche Konzentrationen haben. Ein bis zu 200-facher Unterschied ist dabei keine Seltenheit. Das liegt daran, dass es sich bei den Kopien nicht zwangsläufig um 1:1 Wiederholungen handelt, sondern auch Mutationen darin enthalten sind. Wie viele Kopien es gibt, können wir schon lange bestimmen, nicht aber, welche Mutationen darin enthalten sind und vor allem deren Reihenfolge. Das interessiert uns“, so Amstler.
Als das Team der Genetischen Epidemiologie vor zehn Jahren damit begann, die Region KIV-2 VNTR zu erforschen, waren gerade einmal eine Handvoll Varianten darin bekannt. „In den letzten Jahren haben wir und andere Forschungsgruppen, die das Thema auch aufgegriffen haben, 700 bis 800 Varianten in der Region beschrieben. Was wir aber immer noch nicht wissen, ist: In welcher Wiederholung befindet sich welche Variante? Während die Arbeitsgruppe von Sebastian Schönherr diese Fragestellung informatisch bearbeitet, gehen wir das parallel im Labor an“, sagt Coassin.
Nanopore Sequencing – viele Chancen, eine Schwäche
Dort haben die ForscherInnen um Amstler und Coassin auf Nanopore Sequencing zurückgegriffen und damit einen bedeutenden Fortschritt in der Aufklärung von KIV-2 VNTR erzielt. Bei Nanopore Sequencing wird eine aus der Zelle isolierte DNA durch eine Eiweißpore geleitet. Diese Pore ist so eng, dass tatsächlich nur ein DNA-Strang hindurchpasst. Bei dem Vorgang werden Veränderung im Stromfluss gemessen, die abhängig von der Struktur der jeweiligen Base sind. „Wir messen die Änderung des Elektronenflusses durch die einzelnen Poren. Der Vorteil ist, dass dies völlig unabhängig von Enzymen funktioniert und wir die einzelnen DNA-Moleküle als Ganzes durchlesen können, theoretisch bis zu Millionen Basenpaaren“, erklärt Amstler. Für die Technologie spricht zudem die Handlichkeit des Geräts: Der kleinste Nanopore-Sequenzierer passt tatsächlich in eine Hand. Ein Modell in Laptopgröße kann man im Prinzip bereits innerhalb von vier Tagen das Genom von mehreren Menschen auslesen. Inklusive Vorbereitungszeit können wir innerhalb einer Woche das LPA-Gen von 100 Personen gleichzeitig anschauen und analysieren. Es gibt inzwischen sogar auch Ansätze zur „Bedside“-Sequenzierung in der Klinik mit Analyse in Realzeit“, sagt Coassin.
Allerdings hat das System eine bedeutende Schwäche: Es ist anfällig für Messfehler. „Die Technologie kann man für das gesamte Genom anwenden, oder man liest nur die Regionen, die man bestimmen will und die man bisher nicht anschauen konnte, so wie wir. Wir isolieren die Wiederholungen und schicken sie mit Überlappungen durch den Nanopore-Sequenzierer. Das Problem ist: Diese Repeats (Wiederholungen) sind trotz der Varianten noch so ähnlich, dass die gemessenen Änderungen im Strom zu gering sind. Wir haben uns gefragt, wie wir die Fehler von 1:100 Basen auf etwa 1:10.000 reduzieren können“, erläutert der Forscher. Bei der Suche nach einer Lösung stellte sich als besonders hilfreich heraus, dass PhD-Student Stephan Amstler sowohl Molekulare Medizin als auch Informatik studiert hat. Er entwickelte ein informatisches Analysemodell, das eine Art Barcode für jedes DNA-Molekül in der Sequenzierung (sogenannte Unique Molecular Identifiers, UMIs) verwendet um jedes Molekül zigmal zu lesen und damit eine Fehlerkorrektur für jedes einzelne Molekül durchzuführen. Damit erhält man hochgenaue Sequenzen für jedes einzelne Molekül. Den ForscherInnen ist es damit gelungen, die Fehlerrate auf mindestens 1:10.000 zu reduzieren, die besten Werte lagen jenseits der 1:100.000 -Schwelle (Q50).
„Indem wir einen Mittelwert von mindestens sechs Kopien eines jeden UMI-markierten Moleküls bilden, löschen wir Sequenzierfehler und die realen Mutationen bleiben übrig“, erläutert Amstler. Jede Wiederholung in KIV-2 VNTR durchläuft diesen Prozess. Die gesamte Sequenz kann dann, dank der jeweils mituntersuchten Überlappungen wieder korrekt zusammengesetzt werden. Zur Validierung wurden drei Familien sequenziert mit dem Ergebnis, dass die Sequenzen der Kinder identisch mit jenen der Eltern waren.
„Das Konzept gibt es zwar schon relativ lange im Sequenzierungsfeld und wurde auch schon einmal in einer Arbeit mit Bakterien gezeigt. Es wurde aber noch nie mit einer derart komplexen Genregion gemacht und die informatische Analyse von Nanopore-Daten mit UMIs war bisher kaum reproduzierbar und umsetzbar. Mit unserem automatisierten Softwaretool können wir nun einerseits Dark Regions sichtbar machen und das Ganze ist zudem auch so anwenderfreundlich und reproduzierbar gestaltet, sodass es jeder, der grundlegende Bioinformatik beherrscht, sofort benutzen kann“, sagt Amstler.
BU: Ein Team um Stefan Coassin (r) und Stephan Amstler hat Nanopore Sequencing mit einem UMI Rechenmodell kombiniert und damit bemerkenswerte Ergebnisse erzielt.
Nächste Schritte und Potential
Das von Amstler und Coassin entwickelte Rechenmodell basiert auf europäischen Daten, die am Institut für Genetische Epidemiologie erhoben worden sind. „Wir haben es inzwischen mit 48 Datensätzen aus Afrika, China, dem indischen Subkontinent und Japan getestet und gesehen, dass es auch mit anderen Mutationsmustern funktioniert“, freuen sich die beiden Forscher. In dem aktuell laufenden, vom FWF geförderten Projekt „Haplotypenanalyse im LPA KIV-2 CNV und Imputation“ (PAT5152823; PI: Stefan Coassin) werden sie ca. 2.000 Proben von Individuen aus der ganzen Welt untersuchen, um der Lp(a)-Variabilität zwischen den Bevölkerungsgruppen auf die Spur zu kommen. Stephan Amstler, der zuvor am Institut für Virologie tätig war, sieht viel Potential für die Kombination von Nanopore Sequencing mit dem UMI-Modell in der Forschung, etwa der Mikrobiomforschung (Gut Metagenomics), aber auch in der klinischen Diagnostik, z.B. die Evolution von Viren in PatientInnen. „Im Prinzip kann die Technologie immer anwenden, wenn man perfekte, sehr lange Sequenzen braucht. Es gibt circa 400 komplexe Gene, die medizinisch hochrelevant sind, aber Dark Regions enthalten und deshalb bisher nicht vollständig sequenziert sind. Dazu gehören neben LPA auch andere kardiovaskuläre Gene, Alzheimer-Gene, Tumor-Gene und Gene, die mit Muskelerkrankungen zusammenhängen“, zeigt er die große Breite der möglichen Anwendungen auf.
(Innsbruck, 20. Jänner 2025, Text: T. Mair, Foto: MUI/D. Bullock)
Forschungsarbeit: Amstler, S., Streiter, G., Pfurtscheller, C. et al. Nanopore sequencing with unique molecular identifiers enables accurate mutation analysis and haplotyping in the complex lipoprotein(a) KIV-2 VNTR. Genome Med 16, 117 (2024). https://doi.org/10.1186/s13073-024-01391-8
Links:
Institut für Genetische Epidemiologie