Künstliche Gensynthese
Die künstliche Gensynthese ist eine Methode der synthetischen Biologie, die verwendet wird um künstliche Gene im Labor zu erstellen. Basierend auf der Oligonukleotidsynthese, unterscheidet sie sich insofern von molekularer Klonierung und Polymerase-Kettenreaktion (PCR), als der Anwender keine bereits existierende DNA benötigt. Somit ist es möglich, ein komplettes, doppelsträngiges DNA-Molekül (synthetische DNA) ohne Einschränkungen in Sequenz oder Länge herzustellen. Die Methode wurde verwendet, um funktionsfähige, bakterielle Chromosomen, die in etwa eine Million Basenpaare enthielten, herzustellen.
Die erste Synthese eines kompletten Gens, eine Hefe-tRNA, wurde von Har Gobind Khorana und seinen Mitarbeitern 1972 vollbracht.[1] Die Synthesen des ersten peptid- beziehungsweise proteinkodierenden Gens wurden jeweils in den Laboren von Herbert Boyer und Alexander Markham durchgeführt.[2][3]
Kommerzielle Gensyntheseaufträge werden inzwischen von zahlreichen Firmen weltweit bearbeitet, wobei einige sich speziell auf diesen Zweig der Genetik festgelegt haben.[4] Die derzeitige Herangehensweise der Gensynthese ist meistens eine Kombination aus organischer Chemie und molekularbiologischen Techniken, wobei es sein kann, dass ganze Gene "de novo", ohne bestehende DNA-Vorlage, synthetisiert werden. Gensynthese ist in vielen Feldern der rekombinativen DNA-Technologie ein wichtiges Instrument geworden. Die Synthese von Nukleotidbasen ist oft ökonomischer als klassisches Klonieren oder Mutationsmethoden.
Genoptimierung
Da die Möglichkeit, zunehmend längere DNA-Abschnitte akkurat und für immer geringere Preise herzustellen, immer mehr Nachfrage auf dem Gensynthesefeld hervorruft, wird immer mehr Aufmerksamkeit der Anpassung der Gene für spezielle Zwecke gewidmet. In der frühen Zeit der Genomsequenzierung wurde die Gensynthese als teure Quelle für cDNA verwendet. Diese wurde aus genomischer DNA oder partieller cDNA gewonnen, war aber schwierig zu klonieren. Als qualitativ höherwertige Quellen für cDNA aufkamen war diese Methode nicht mehr zwingend notwendig.
Große Mengen an Proteinen aus natürlich vorkommenden Gensequenzen oder zumindest der proteinkodierenden Region des Gens, dem offenen Leserahmen, zu gewinnen, kann oft schwierig sein. Dies ist ein Problem, welches Inhalt verschiedener wissenschaftlicher Konferenzen war.[5][6] Viele der von Molekularbiologen benötigten Proteine sind normal so reguliert, dass sie in Wildtyp-Zellen nur sehr geringfügig exprimiert werden. Durch angepasstes Design dieser Gene lässt sich die Genexpression in vielen Fällen verbessern. Aufgrund der Fehlertoleranz ist das Umschreiben des offenen Leserahmens bedingt möglich. So kann man bis zu einem Drittel der Basenpaare ändern, wobei nach wie vor das gleiche Protein produziert wird. Die Zahl möglicher Designs der DNA-Sequenz für ein bestimmtes Protein ist astronomisch. Für eine Proteinsequenz von 300 Aminosäuren gibt es über 10150 Codonkombinationen, die ein identisches Protein produzieren würden. Optimierungsmethoden, wie das Austauschen kaum verwendeter Codons durch eher übliche, haben manchmal drastische Wirkung. Des Weiteren können noch Optimierungen wie das Entfernen von Sekundärstrukturen genutzt werden. Im Fall von E. coli wird abschließend die Proteinexpression durch überwiegende Verwendung von Codons, passend zu tRNA, die Aminosäuren enthalten, die während Unterversorgung gespeichert werden, maximiert.[7] Zur Bewältigung der Komplexität der verschiedenen gleichzeitigen Optimierungen werden inzwischen Computerprogramme verwendet.[8] Ein gut optimiertes Gen kann die Proteinexpression um den Faktor 2 bis 10 verbessern. In manchen Fällen sind Verbesserungen um den Faktor 100 dokumentiert. Aufgrund der großen Anzahl von geänderten Nukleotiden ist die Gensynthese der einzig geeignete Weg, die umgeschriebenen Gene zu kreieren.
Standardmethoden
Chemische Synthese von Oligonukleotiden
Oligonukleotide können chemisch synthetisiert werden, indem in einer Phosphoramidit-Synthese Nukloeosid-Phosphoramidite miteinander zur Reaktion gebracht werden. Diese Bausteine liegen zunächst geschützt vor, d. h. an ihre Amine, Hydroxygruppen und Phosphatgruppen sind Schutzgruppen gebunden, die während der Oligonukleotidsynthese nicht reagieren und hinterher entfernt werden. In jedem Syntheseschritt wird jedoch die jeweils nächste 5'-Hydroxygruppe des Produkts entschützt, damit das nächste Phosphoramidit hinzugefügt und eine neue Base sich anlagern kann. Die Kette wächst vom 3' zu 5' Ende, also genau umgekehrt zur Biosynthese.
Da es sich um chemische Prozesse handelt, sinkt die Ausbeute an Oligonukleotiden mit der korrekten Sequenz mit der Sequenzlänge. Eine kleine Fehlerwahrscheinlichkeit in jedem Syntheseschritt summiert sich unweigerlich auf. Somit ist diese Technik eher zur Produktion von kurzen Sequenzen geeignet. Das augenblickliche Limit für Oligonukleotide mit ausreichender Qualität, die direkt für biologische Prozesse verwendet werden sollen, sind 200 bp. Mittels HPLC kann das Syntheseprodukt von falschen Sequenzen gereinigt werden.
Wird eine große Zahl unterschiedlicher Oligonukleotide gleichzeitig auf ein Trägermaterial (z. B. Glas) synthetisiert, nennt man das Produkt "Genchip".
Annealen von Oligonukleotiden
Normalerweise wird ein Satz individuell designter Oligonukleotide über automatisierte Solidphase-Synthesizer hergestellt, danach aufgereinigt und dann über spezifisches Annealing und Ligation oder Polymerasereaktion verbunden. Um das Annealing der Oligonukleotide zu verbessern, basiert der Syntheseschritt auf einer Kombination aus thermostabiler DNA-Ligase und einem Polymeraseenzym. Es sind heutzutage verschiedenste Methoden der Gensynthese beschrieben. Beispiele hierfür sind die Ligation von phosphorylierten überlappenden Oligonukleotiden,[1][2] die Fok I[3] und eine für die Gensynthese angepasste Form der Ligasekettenreaktion. Zusätzlich wurden einige PCR-Assembly-Herangehensweisen beschrieben.[9] Sie verwenden normalerweise Oligonukleotide mit der Länge von 40 bis 50 bp, die miteinander überlappen. Diese Oligonukleotide werden so designt, dass sie zusammen den Großteil der Sequenz beider Stränge abdecken. Das vollständige Molekül wird anschließend schrittweise über Overlap-Extension-PCR (OE)[9] über TBIO-PCR[10] oder über kombinierte Methoden hergestellt.[11] Die übliche Größe synthetisierter Gene beträgt 600 bis 1.200 bp, obwohl schon wesentlich längere Gene durch Ligation von unter 1.000 bp langen Teilen erzeugt wurden. In dieser Größenordnung ist es nötig, für die einzelnen Teile jeweils mehrere mögliche Klone anhand automatisierter Sequenzierungsmethoden zu testen.
Einschränkungen
Da darüber hinaus das Erzeugen des vollständigen Gens von der effizienten und der genauen Anordnung von langen, einzelsträngigen Oligonukleotiden abhängig ist, ergeben sich einige kritische Parameter für den Erfolg der Synthese: größere Sequenzregionen mit Sekundärstrukturen, die von eingeschlossenen Wiederholungen verursacht werden; außergewöhnlich hoher oder niedriger GC-Gehalt; sich wiederholende Strukturen. Normalerweise können diese Segmente eines Gens nur durch Aufteilen auf mehrere kleine Teile und anschließendes Zusammenfügen der einzelnen Teile erzeugt werden. Das führt wiederum zu wesentlicher Erhöhung des Zeit- und Arbeitsaufwands.
Das Ergebnis einer Gensynthese hängt stark von der Qualität der Oligonukleotide, die verwendet wurden, ab. Bei diesem auf Annealing basierenden Vorgehen wirken sich die Oligonukleotide direkt und exponentiell auf die Richtigkeit des Produkts aus. Alternativ muss, nachdem durch Gensynthese Oligonukleotide geringerer Qualität zusammengeführt wurden, mehr Aufwand betrieben werden, um die Qualität des Gens nachträglich zu sichern. Dies geschieht normalerweise durch Standardklonieren mit anschließender Transformation und Analyse der Klone durch Sequenzieren. Das ist allerdings ein zeitaufwändiger Prozess.
Ein weiteres Problem, das mit den üblichen Gensynthesemethoden auftritt, ist das häufige Vorkommen von Sequenzfehlern aufgrund der Verwendung von chemisch synthetisierten Oligonukleotiden. Als Folge davon fällt die Prozentzahl an richtigen Produkten mit steigender Anzahl verwendeter Oligonukleotide stark ab.
Das Mutationsproblem kann durch kürzere Oligonukleotide als Bausteine des Gens gelöst werden. Allerdings erfordern alle Assemblemethoden, dass die Primer in einem Gefäß zusammengegeben werden. Dadurch können kurze Überhänge nicht immer mit ihren komplementären Primern präzise und richtig annealen, was wiederum die Bildung des vollständigen Gens beeinträchtigt.
Manuelles Erstellen von Oligonukleotiden ist eine Laborpraxis und garantiert nicht zwingend die erfolgreiche Synthese des gewünschten Gens. Für ein optimales Ergebnis fast aller Annealings muss die Schmelztemperatur der überlappenden Regionen für alle Oligonukleotide ähnlich sein. Die notwendigen Primeroptimierungen sollten unter Verwendung spezialisierter Oligonukleotid-Designprogramme durchgeführt werden. Hierbei wurden schon einige Lösungen automatisiertem Primerdesigns für Gensynthese gefunden.[12][13][14]
Fehlerkorrigierende Verfahren
Paralleles Sequenzieren großer Oligobibliotheken wird als Mittel zur Auffindung passender Moleküle verwendet. Bei einem Verfahren werden Oligonukleotide auf einer 454 Pyrosequenzierplattform sequenziert und ein Robotersystem bildet die einzelnen Beads ab und wählt die zur Sequenz passenden aus.[15]
Zunehmend werden auch ganze Sätze von Genen gefragter, mit untereinander ähnlichen Sequenzen oder mit verschiedenen Sequenzen, die nur wenige Basenpaar-Unterschiede haben. Nahezu alle der therapeutischen Proteine in der Entwicklung, wie monoklonale Antikörper, werden durch Testen zahlreicher Genvarianten zur verbesserten Funktion oder Expression optimiert.
Siehe auch
Einzelnachweise
- H. G. Khorana, K. L. Agarwal, H. Büchi, M. H. Caruthers, N. K. Gupta, K. Kleppe, A. Kumar, E. Otsuka, U. L. RajBhandary, J. H. Van de Sande, V. Sgaramella, T. Terao, H. Weber, T. Yamada: Studies on polynucleotides. 103. Total synthesis of the structural gene for an alanine transfer ribonucleic acid from yeast. In: Journal of molecular biology. Band 72, Nummer 2, Dezember 1972, ISSN 0022-2836, S. 209–217, doi:10.1016/0022-2836(72)90146-5, PMID 4571075.
- K. Itakura, T. Hirose, R. Crea, A. Riggs, H. Heyneker, F. Bolivar, H. Boyer: Expression in Escherichia coli of a chemically synthesized gene for the hormone somatostatin. In: Science. 198, 1977, S. 1056–1063, doi:10.1126/science.412251, PMID 412251.
- M. D. Edge, A. R. Green, G. R. Heathcliffe, P. A. Meacock, W. Schuch, D. B. Scanlon, T. C. Atkinson, C. R. Newton, A. F. Markham: Total synthesis of a human leukocyte interferon gene. In: Nature. Band 292, Nummer 5825, August 1981, ISSN 0028-0836, S. 756–762, doi:10.1038/292756a0, PMID 6167861.
- Die Firma DNA 2.0 wurde zum Beispiel 2003 in Menlo Park als eine "synthetic genomics company" gegründet (quotated page (Memento des Originals vom 7. August 2012 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. ).
- Difficult to Express Proteins. In: Sixth Annual PEGS Summit. Cambridge Healthtech Institute. Archiviert vom Original am 11. Mai 2010. Abgerufen am 11. Mai 2010.
- Kathy Liszewski: New Tools Facilitate Protein Expression. In: Genetic Engineering & Biotechnology News. Mary Ann Liebert, 1. Mai 2010, S. 1, 40–41, archiviert vom Original am 9. Mai 2010; abgerufen am 11. Mai 2010 (Serie: Bioprocessing, Vol. 30, Issue 9).
- M. Welch, S. Govindarajan, J. E. Ness, A. Villalobos, A. Gurney, J. Minshull, C. Gustafsson: Design parameters to control synthetic gene expression in Escherichia coli. In: PloS one. Band 4, Nummer 9, 2009, ISSN 1932-6203, S. e7002, doi:10.1371/journal.pone.0007002. PMID 19759823, PMC 2736378 (freier Volltext) .
- Protein Expression. DNA2.0. Abgerufen am 11. Mai 2010.
- Fuhrmann M, Oertel W, Hegemann P: A synthetic gene coding for the green fluorescent protein (GFP) is a versatile reporter in Chlamydomonas reinhardtii. In: Plant J.. 19, Nr. 3, August 1999, S. 353–361. doi:10.1046/j.1365-313X.1999.00526.x. PMID 10476082.
- Mandecki W, Bolling TJ: FokI method of gene synthesis. In: Gene. 68, Nr. 1, August 1988, S. 101–107. doi:10.1016/0378-1119(88)90603-8. PMID 3265397.
- Stemmer WP, Crameri A, Ha KD, Brennan TM, Heyneker HL: Single-step assembly of a gene and entire plasmid from large numbers of oligodeoxyribonucleotides. In: Gene. 164, Nr. 1, Oktober 1995, S. 49–53. doi:10.1016/0378-1119(95)00511-4. PMID 7590320.
- Gao X, Yo P, Keith A, Ragan TJ, Harris TK: Thermodynamically balanced inside-out (TBIO) PCR-based gene synthesis: a novel method of primer design for high-fidelity assembly of longer gene sequences. In: Nucleic Acids Res.. 31, Nr. 22, November 2003, S. e143. doi:10.1093/nar/gng143. PMID 14602936.
- Young L, Dong Q: Two-step total gene synthesis method. In: Nucleic Acids Res.. 32, Nr. 7, 2004, S. e59. doi:10.1093/nar/gnh058. PMID 15087491.
- Hillson NH, Rosengarten RD, Keasling JD: j5 DNA Assembly Design Automation Software. In: ACS Synthetic Biology. 1, Nr. 1, 2012, S. 14–21. doi:10.1021/sb2000116.
- Matzas M et al. DNA-Sequenzierung#Pyrosequenzierung: High-fidelity gene synthesis by retrieval of sequence-verified DNA identified using high-throughput pyrosequencing. In: Nature Biotechnology. 28, 2010, S. 1291–1294. doi:10.1038/nbt.1710. PMID 21113166.