Mitochondriale Spurenleser
Bereits seit mehreren Jahren entwickelt das Institut für Genetische Epidemiologie mit großem Erfolg frei verfügbare und skalierbare Software für ForscherInnen weltweit. Nun konnte im Bereich der mitochondrialen Genom-Forschung eine weitere Software entwickelt und publiziert werden, welche es ermöglicht, Verunreinigungen im Genom zu entdecken, die bei Publikationen oft übersehen werden und so zu falschen Schlüssen führen.
Aufgrund fehlender Tools wird bei Standard-Qualitätskontrollen von Sequenzier-Projekten oft auf die Detektion von Kontamination verzichtet. Kontamination beschreibt den Zustand, in welcher DNA aus unterschiedlichen Proben fälschlicherweise in einer einzigen Probe enthalten ist (sogenannte “In-Sample Contamination”). Kontamination in der mitochondrialen DNA (mtDNA) zeigt sich dadurch, dass sich Genvarianten nur in einer gewissen Anzahl der Kopien der mtDNA niederschlagen. Somit entsteht das gleiche Muster wie bei mitochondrialen Heteroplasmien und damit eine hohe Verwechslungsgefahr mit Kontamination.
Software zu Erkennung von Kontamination
Bereits im Jahr 2016 haben ForscherInnen am Institut für Genetische Epidemiologie (Direktor: Florian Kronenberg) das Problem erkannt und eine Methode skizziert, um solche Verwechslungen zu detektieren. Ein Blick auf die rezente Literatur zeigt jedoch, dass das Problem immer noch zu wenig Beachtung findet und falsche Schlussfolgerungen publiziert werden. Im Rahmen einer neuen Arbeit haben die ForscherInnen der Genetischen Epidemiologie sich dem Problem angenommen, diese umfassend erweitert und daraus eine neuartige Software entwickelt, welche nun im renommierten Journal Genome Research publiziert wurde.
“Das Konzept der Software beruht auf dem Prinzip, dass innerhalb einer Probe nach unterschiedlichen mitochondrialen Haplogruppen gesucht wird. Mit Hilfe von statischen Methoden und einem Detektions-Ansatz speziell für mtDNA Mutationen kann somit erkannt werden, ob entdeckte Muster einer Kontamination entsprechen oder natürlichen Ursprung haben”, so Hansi Weissensteiner, Erstautor der Arbeit.
Dem Team der Genetischen Epidemiologie kommen nun deren, in den vergangenen Jahren geleisteten Vorarbeiten auf dem Gebiet der mitochondrialen DNA zugute: Mit den Tools Haplogrep und mtDNA-Server wurden bereits zwei Methoden entwickelt, die weltweit Anerkennung gefunden haben und in Form von Cloud-Webservices an der Medizin Uni Innsbruck für Forschungsgruppen weltweit bereitgestellt werden. “Haplogrep und mtDNA-Server haben sich als Standard-Tools bei Tausenden von Usern etabliert. Mit dieser neuen Software ist es nun für ForscherInnen möglich, auch Kontamination-Detektionen für große mtDNA Studien eigenständig durchführen zu können. ForscherInnen können ihre Daten entweder über den Browser hochladen, oder natürlich auch auf dem eigenen Rechner ausführen und bekommen innerhalb von Minuten das Resultat. Es freut uns sehr, unserer mtDNA Suite ein neues Tool hinzufügen zu dürfen”, so der korrespondierende Autor Sebastian Schönherr.
Rückschluss auf Verunreinigung auf das Genom
Die neu entwickelte Software namens “haplocheck” kann zudem auch für n(nukleäre)DNA ForscherInnen von großer Bedeutung sein. Die mitochondriale DNA erlaubt nämlich auf sehr effiziente Weise Kontamination festzustellen, wozu weniger als 0.5% der üblichen Datenmengen von Genom-Projekten analysiert werden müssen. Im Rahmen der Arbeit untersuchte das Team, inwieweit der detektierte mtDNA Verunreinigungsgrad Rückschluss auf den Grad der nDNA Verunreinigung gibt.
Das Team verwendete dabei die frei verfügbaren Daten des 1000 Genom- Projektes, aus denen das mitochondriale Genom ausgelesen und das Kontaminations-Niveau bestimmt wurde. “Die interessante Nachricht ist, dass haplocheck als Proxy Software sehr gut funktioniert. Wir konnten in unseren Versuchsreihen ganz klar zeigen, dass vorhandene Kontamination der nukleären DNA stets mittels hapolocheck erkannt wird. Auch der nDNA Verunreinigungsgrad konnte gut vorausgesagt werden, solange die sequenzierten Proben vom selben Gewebe stammen”, so die ForscherInnen.
Cloud Services seit 2008
Die Entwicklung von frei verfügbarer Software wird an der Genetischen Epidemiologie seit 2008 verfolgt. “Unser Ziel ist es, dass die Software von so vielen ForscherInnen wie möglich auf einfache Art und Weise verwendet werden kann und damit frei zugänglich ist. Unsere Erfahrung zeigt, dass mit der Publikation nun die Arbeit an der Software erst richtig beginnt und viele kleine Erweiterungen notwendig sind, um sie wirklich als Standard im Feld durchzusetzen bzw. weiterzuentwickeln. Wir sind jedenfalls sehr froh, dass wir mit der IT Abteilung der Medizin Uni Innsbruck einen starken Ansprechpartner haben, um einen solchen Service anbieten zu können” so die ForscherInnen um Hansi Weissensteiner, Lukas Forer und Sebastian Schönherr.
Eine erste Feuerprobe konnte die Software bereits bestehen: Das Broad Institut (Harvard und MIT) hat für die weltweit größte frei verfügbare Ressource für genetische Variationen beim Menschen (gnomAD Browser) die haplocheck Software für die Auswertung von 56.000 mtDNA Genomen erfolgreich verwendet.
(03.02.2021, Text: D. Heidegger/S. Schönherr, Foto: AdobeStock/crevis und MUI/D.Bullock)
Links:
Haplocheck Paper: Contamination detection in sequencing studies using the mitochondrial phylogeny
Haplogrep - Mitochondriale Haplogruppen-Bestimmung
Broad Institute of Harvard and MIT
Institut für Genetische Epidemiologie
myPoint Archiv:
Mitochondrien und Infektionsrisiko