Die Buchstaben unseres Lebens

20 Jahre Humangenomprojekt - was hat die Entschlüsselung des Genoms gebracht?

14.09.2023, 17:50 Uhr

Hat das Humangenomprojekt zunächst mehr Fragen aufgeworfen als gelöst, so können Patientinnen und Patienten nun tatsächlich von den Erkenntnissen profitieren. (Foto: Yay Images/AdobeStock)

Hat das Humangenomprojekt zunächst mehr Fragen aufgeworfen als gelöst, so können Patientinnen und Patienten nun tatsächlich von den Erkenntnissen profitieren. (Foto: Yay Images/AdobeStock)


20 Jahre ist es schon her, dass das Humangenomprojekt als abgeschlossen erklärt wurde. Als das Projekt 1990 startete, gab es viele Hoffnungen, Erwartungen und Diskussionen. Werden wir durch diese Sequenzaufklärung gläsern? Interessieren sich womöglich Krankenversicherungen und Arbeitgeber für unser Innerstes? Oder können wir durch die Kenntnis des Humangenoms Krankheiten besser verstehen und finden gar eine Lösung gegen Tumorerkrankungen?

Grundlage für das öffentlich geförderte Mammutprojekt war der Zusammenschluss verschiedener Wissenschaftler aus der ganzen Welt. Bereits 1988 wurde auf einer Konferenz in Cold Spring Harbor „HUGO“ ins Leben gerufen: die Human-Genom-Organisation. Relativ schnell bestand HUGO aus 220 Wissenschaftlern aus 23 Ländern, die sich die Arbeit an den verschiedenen menschlichen Chromosomen untereinander aufteilten. Letztlich beteiligten sich insgesamt mehr als 1000 Wissenschaftler an dem Projekt. 

Das Ziel war zu der damaligen Zeit sehr ambitioniert: Das humane Genom sollte innerhalb von 15 Jahren mit einem Budget von 3 Milliarden US-Dollar komplett aufgeklärt sein. Zu der Zeit war die Sequenzierung noch relativ aufwendig, langsam und teuer. Bewegung kam in das Projekt, als sich 1998 Craig Venter mit seiner Firma Celera Corporation mithilfe privater Geldgeber ebenfalls die Sequenzierung des menschlichen Genoms vornahm – jedoch mit einer etwas anderen technischen Herangehensweise. Venter hatte es sich zum Ziel gesetzt, innerhalb von drei Jahren für 300.000 US-Dollar sein Ergebnis zu liefern. Zu diesem Zeitpunkt waren über HUGO erst 5 % des Genoms sequenziert (Abb. 1).

Abb. 1: Fortschritt der Aufklärung der Genomsequenzen innerhalb des Humangenomprojekts

Zwischen der Human-Genom-Organisation und der Firma Celera kam es zu einem Wettrennen, wer schneller sein würde, die komplette humane Genom-Sequenz zu veröffentlichen. 2001 erschienen in derselben Woche die ersten Veröffentlichungen in den beiden renommiertesten Fachjournalen: Craig Venter publizierte in „Science“ und das Internationale Human-Genom-Consortium in „Nature“.

Gleichzeitig mit dem Humangenomprojekt wurde 1990 auch das „Ethical, Legal, and Social Implications (ELSI) Research Program“ gestartet, das die ethischen, rechtlichen und sozialen Aspekte der Genomforschung beleuchten sollte. Die Befürchtungen in der Gesellschaft waren, dass das Wissen missbraucht werden könnte und sich Versicherungen und Arbeitgeber für die Genomsequenzen interessieren würden. Damals war es eine Innovation, die für das Humangenomprojekt als absolut nötig betrachtet wurde. Mittlerweile ist es Standard, dass zu jedem Forschungsprojekt auch die „ELSI“ berücksichtigt werden – nicht nur in der medizinischen Forschung.

Was wurde 2001 eigentlich veröffentlicht?

Das, was 2001 publiziert wurde, war allerdings noch ein gutes Stück davon entfernt, wirklich eine komplette DNA-Sequenz eines Menschen zu sein. Zunächst war es nicht EIN einziges Genom. Bei Celera wurden Zellen von fünf Spendern verwendet, um daraus die DNA zu isolieren, und beim Human-Genom-Consortium lieferten sogar noch mehr Menschen ihre DNA, was natürlich auch den verschiedenen Standorten der beteiligten Wissenschaftler geschuldet war. Die erste Draft-Version umfasste circa 90 % der Gesamt-Sequenz und enthielt noch über 150.000 unbekannte Regionen. 2003 waren die meisten der Lücken bereits geschlossen, vollständig komplettiert war die Genom-Sequenz allerdings erst 2022.

Erstaunlich an der ersten humanen Gesamtsequenz war ein großer Anteil an Wiederholungseinheiten, also Abfolgen von Nukleobasen, die mehrmals im Genom vorkommen und auf sogenannte Transposons zurückzuführen sind. Dabei handelt es sich um mobile genetische Elemente, die sich zum Teil im Genom vermehren und zu chromosomalen Rearrangements führen können. Aber auch Duplikationen größerer Chromosomen-Segmente wurden in circa 2% der Gesamt­sequenz entdeckt und auf Reparaturmechanismen nach Doppelstrangbrüchen zurückgeführt.

Neben technischen Aspekten wurden 2001 bereits auch einige für die medizinische Forschung relevante Daten veröffentlicht. So konnten über die Draft-Version des Genoms mehr als 30 Gene im Genom genauer kartiert werden, die mit Erkrankungen in Verbindung gebracht wurden, wie z. B. der BRCA2-Genort, der mit einem erhöhten Brustkrebsrisiko assoziiert ist. Außerdem wurden 18 sogenannte paraloge Gene für Zielproteine von Wirkstoffen gefunden, wie beispielsweise vermeintliche Gene für weitere Dopaminrezeptoren oder purinerge Rezeptoren.

Was hat das Humangenomprojekt gebracht?

Die Mitglieder des Consortiums hatten sich vorab darauf geeinigt, dass jede Sequenz, sobald sie fertiggestellt war, im WorldWideWeb verfügbar gemacht wird – schließlich wurde das Projekt auch aus öffentlichen Mitteln finanziert. In der International Nucleotide Sequence Database Collaboration (www.insdc.org) sind die DNA-Datenbanken aus Japan, Europa und den USA zusammengeschlossen. Allein in der US-amerikanischen GenBank sind mittlerweile 19,6 Billionen Basenpaare aus über 2,9 Milliarden Nukleotidsequenzen für 504.000 beschriebene Arten hinterlegt. Diese immense Menge an Daten, die sich in den letzten Jahren angesammelt hat, war nur dadurch möglich, dass sich die Sequenziermethoden grundlegend geändert haben. Während zunächst die Automatisierung der sogenannten Sanger-Sequenzierung für eine Beschleunigung gesorgt hatte, werden inzwischen ganz andere Techniken verwendet als noch zu Beginn des Humangenomprojekts. Mit den Neuentwicklungen (next generation sequencing, NGS) reduzierten sich die Kosten und der Zeitaufwand für die Genomsequenzierung enorm. Erklärtes Ziel war sehr frühzeitig, dass die Sequenzierung eines kompletten menschlichen Genoms für 1000 US-Dollar zu haben sein sollte (Abb. 2)! Dieses Ziel wurde erreicht und mit 600 US-Dollar sogar etwas übertroffen. Für all diejenigen, die sich dafür interessieren: Man muss schon genauer hinschauen, was die verschiedenen Anbieter tatsächlich machen und mit welcher „Abdeckung“ das Genom sequenziert wird, also wie genau die Daten dann auch wirklich sind

Abb. 2: Genom-Sequenzierungskosten seit 2001 (nach [www.genome.gov/sequencingcosts/])

Nach wie vor gilt jedoch, dass nicht „einfach“ die DNA eines Chromosoms vom Anfang bis zum Ende gelesen werden kann. Vielmehr werden kurze Fragmente analysiert, die anschließend wie Puzzlestücke zusammengesetzt werden müssen. Dass das bei der Größe des menschlichen Genoms nicht mehr allein vom menschlichen Auge gemacht werden konnte, sondern von Computern mit entsprechender Software übernommen werden musste, war eine weitere wichtige technische Entwicklung. Während des Humangenomprojekts stieg deshalb die Bedeutung der Bioinformatik enorm. Inzwischen ist sie nicht mehr aus den Naturwissenschaften wegzudenken und Grundlage für all die anderen „Omic“-­Ansätze wie Transkriptomic, Metabolomic, Proteomic, Lipidomic etc. Mithilfe der Bioinformatik wurde es erst möglich, die immensen Daten aufzubereiten und zu verwalten. Diese technischen Fortschritte ermöglichten es beispiels­weise Anfang 2020 auch, innerhalb weniger Wochen nach Auftreten der ersten COVID-19-Infektionen die Sequenz von SARS-CoV-2 aufzuklären und der Welt zur Verfügung zu stellen.

Das primäre Ziel des Humangenomprojektes war allerdings nicht die Weiterentwicklung der Bioinformatik oder der Sequenziertechniken. Vielmehr erhoffte man sich von der Sequenzierung des menschlichen Genoms vor allem auch Erkenntnisse über Krankheitsursachen und neue Therapieansätze. Hatte man noch 1990 angenommen, dass unser humanes Genom ungefähr 100.000 Gene umfasst, kam es fast einer Ernüchterung gleich, als durch das Humangenomprojekt klar wurde, dass wir mit circa 25.000 Genen auskommen, die jedoch zum Teil recht komplex aufgebaut sind. Nur etwa 1,2 bis 2% unserer 3,2 Milliarden Basenpaare langen DNA liefern die Informationen für Proteine, wobei ein Gen häufig nicht nur für ein Protein codiert. Vielmehr kann das Primärtranskript dieses Gens über sogenanntes alternatives Spleißen verschiedene Teile „verlieren“ und deshalb in verschiedene Proteine übersetzt werden.

Angaben wie „circa“ oder „etwa“ klingen nicht nach einer exakten Wissenschaft und nach der genauen Sequenzierung eines kompletten Genoms. Man muss sich jedoch vor Augen führen, was das Ergebnis der Sequenzanalyse ist: eine Abfolge der Nukleobasen Adenin (A), Guanin (G), Cytosin (C) und Thymin (T). Nur an sogenannten Consensus-Sequenzen, also bereits bekannten, bestimmten Abfolgen dieser Basen, lassen sich beispielsweise der Start und das Ende eines unbekannten Gens identifizieren. Allerdings können auch leicht abweichende Consensus-Sequenzen noch „funktionieren“, weshalb es nicht eineindeutig klar ist, wie viele Gene tatsächlich in unserem Genom codiert sind. Bessere Auskunft darüber geben Informationen aus anderen Omic-­Untersuchungen, wie die Transkriptomic, die die Gesamtheit der mRNA analysiert, oder aber die Proteomic, die die verschiedenen Proteine in Zellen aufschlüsselt. Wir wissen aber auch, dass nicht in allen unseren Körperzellen immer alle Gene transkribiert und translatiert werden, sodass diese Analysen ebenfalls keine exakten Rückschlüsse zulassen.

Zahlreiche große Nachfolgeprojekte sollen die neu entstandenen Fragen beantworten

Je mehr Daten produziert wurden und je mehr die Forscher zu wissen glaubten, umso mehr Fragen kamen wieder auf. Wenn nur etwa 2% unserer DNA für Proteine codieren, welche Bedeutung haben dann eigentlich die restlichen ungefähr 98% unseres Genoms? Eine neue Frage, die mit einem neuen Großprojekt beantwortet werden sollte: Encode (Encyclopedia of DNA Elements, www.genome.gov/ENCODE/). 2003 wurde das Projekt gestartet und lieferte wieder Unmengen an Daten, die schließlich zeigten, dass 80% des Genoms für biologische Funktionen codieren, zu denen wiederum 20% unseres Genoms gehören, die aus Steuerungselementen bestehen. Diese Steuerungen sorgen dafür, dass die Gene zum richtigen Zeitpunkt in der richtigen Zelle exprimiert werden (www.nature.com/encode).

Die andere Enttäuschung aus dem Humangenomprojekt war, dass sich aus den DNA-Sequenzen nicht „einfach so“ ablesen lässt, wie hoch beispielsweise bei dem einen Menschen das Risiko für einen Herzinfarkt ist oder bei dem anderen für eine Tumorerkrankung. Und überhaupt war unbekannt, was in den 3,2 Milliarden Buchstaben dafür sorgt, dass wir individuell so unterschiedlich sind. Durch die neue Sequenziertechnik war es möglich geworden, das komplette Genom einzelner Personen in recht kurzer Zeit aufzuklären. Es zeigte sich, dass jedes Genom sich in 3,5 Mio. Einzel-Nukleotid-Austauschen (single nucleotide polymorphisms, SNP) von der ursprünglichen Referenz-Sequenz unterscheiden. Diese kleinen Unterschiede machen uns also zu den Individuen, die wir sind. Die Angst vor großen Projekten mit vielen Daten schien mit dem Humangenomprojekt gebrochen worden zu sein. Im Internationalen HapMap Project wurden ab 2002 die Muster der SNPs genauer analysiert, mittlerweile ist mit dem 1000-Genome-Projekt ein neuer Ansatz gefolgt, in dem Genomsequenzen von 1000 gesunden Menschen auf der ganzen Welt verglichen werden. 2005 wurde zudem das Cancer Genome Atlas Project (www.cancer.gov/ccg/research/genome-sequencing/tcga) gestartet, bei dem für jede der 230 Tumorarten Proben aus 500 Patienten entschlüsselt werden sollten. Eine umfassende Datenbank mit den bisher identifizierten Mutationen verschiedener Tumoren steht mittlerweile mit COSMIC (Catalogue of Somatic Mutations in Cancer, https://cancer.sanger.ac.uk/cosmic) zur Verfügung. Und mit PharmGKB (www.pharmgkb.org) ist eine Datenbank verfügbar, die die Wirksamkeit verschiedener Arzneistoffe in Menschen mit bestimmten SNPs in Genen für Zielmoleküle oder metabolisierende Proteine assoziiert.

Was bringen die Erkenntnisse den Patientinnen und Patienten?

Zunächst einmal die gute Nachricht: Wir sind trotz der zahlreichen Omic-Projekte nach wie vor noch nicht gläsern. Unsere DNA-Sequenz ist nur ein Teil unseres Ichs, und wir werden von zusätzlichen Faktoren, wie beispielsweise unsere Epigenetik oder unsere Mikrobiota, beeinflusst. Nicht nur aus diesem Grund sind wir noch immer weit davon entfernt, Designer-Babys zu entwerfen.

Aber dennoch: Die Genomdaten verändern nicht nur die Diagnostik von Krankheiten, sondern auch die Therapien. Ob Kinder von einer Erbkrankheit betroffen sind, lässt sich inzwischen einfach nachweisen. Auch einige Risikogene für Erkrankungen, wie beispielsweise BRCA (BReast CAncer), das in bestimmten Varianten die Wahrscheinlichkeit für Brustkrebs stark erhöht, können genutzt werden. Andere Erkrankungen, wie beispielsweise die des Herz-Kreislauf-Systems, hängen jedoch von mehreren Genen ab, sodass es schwieriger ist, ein persönliches Risiko allein aus der DNA-Sequenz abzuleiten. Wie kann das Gesamtrisiko aussehen, wenn eine Person sowohl „schützende“ Gen-Varianten trägt als auch Risiko-Varianten? Fragen, die nach wie vor nicht geklärt sind.

Deutliche Fortschritte sind in der Therapie zu verzeichnen, beispielsweise bei Tumorerkrankungen. Während man in früheren Zeiten recht pauschal den Lungen- oder den Magenkrebs behandelte, sind inzwischen die molekularen Details der Tumorzellen relevant. Welche Proteine, welche Kinasen oder Transkriptionsfaktoren sind mutiert? Können diese Moleküle mit einem spezifischen Inhibitor adressiert werden? Diese Aspekte sind mittlerweile oftmals wichtiger, als dass die Tumorzelle aus der Lunge oder aus dem Magen stammt. Auch ganz neue Therapieansätze, wie die Sirane, würde es wahrscheinlich ohne das Genomprojekt und all die nachfolgenden Großprojekte nicht geben. Ganz zu schweigen von den Gentherapeutika oder den anderen Arzneimitteln für neuartige Therapien, die auf Genen, Geweben oder Zellen basieren (Advanced Therapy Medicinal Products, ATMP). Sicherlich werden wir auf diesen Gebieten noch einige Fortschritte erwarten können, vor allem wenn Genscheren irgendwann sicherer anwendbar sind.

Was wesentlich greifbarer ist, aber bisher nur bedingt umgesetzt wird, ist die stratifizierte Arzneimitteltherapie. Grundlage dafür sind die individuellen Unterschiede durch die persönliche SNP-Ausstattung beispielsweise der metabolisierenden Enzyme. Das kann dazu führen, dass nicht jeder Arzneistoff in allen Patientinnen und Patienten gleich wirksam ist. Durch eine pharmakogenetische Analyse können die SNPs identifiziert und die richtigen Wirkstoffe ausgewählt werden.

Fazit

Das Humangenomprojekt hat zunächst mehr Fragen aufgeworfen als gelöst. Durch die nachfolgenden Großprojekte hat sich das Bild aus pharmazeutisch-medizinischer Perspektive mittlerweile ziemlich gewandelt, und Patientinnen und Patienten können tatsächlich von den Erkenntnissen profitieren. Welche Fortschritte dabei unmittelbar auf das Humangenomprojekt zurückzuführen sind oder „einfach nur“ auf die weitergeführten Forschungsarbeiten, lässt sich inzwischen nicht mehr auseinanderhalten.

Literatur

Chan EY Advances in sequencing technology. Mutation Research 2005; 573:13–40

Fact Sheet “Human Genome Project”. www.genome.gov/about-genomics/educational-resources/fact-sheets/human-genome-project

International Human Genome Sequencing Consortium: Initial sequencing and analysis of the human genome. Nature 2001;409:860–921

Lee C et al. Three decades of the Human Genome Organization. Am J Med Genet 2021;185A:3314–3321

Sayers EW et al. GenBank 2023 update. Nucleic Acids Research 2023; 51:D141–D144

Venter JC et al. The Sequence of the Human Genome. Science 2001;291:1304–1351


Dr. Ilse Zündorf, Institut für Pharmazeutische Biologie der Uni Frankfurt, DAZ-Autorin
redaktion@daz.online


Prof. Dr. Robert Fürst, Institut für Pharmazeutische Biologie der Uni Frankfurt, DAZ-Autor
redaktion@daz.online


Diesen Artikel teilen:


0 Kommentare

Das Kommentieren ist aktuell nicht möglich.