Leerlingen: Eric Slob en Inge Wortel
Docent: Sandra Mooren
School: Christelijk Gymnasium Utrecht, Utrecht
Inleiding
In 1869 ontdekte de Zwitserse arts Friedrich Miescher een stof die hij ‘nucleïne’ noemde.
Enige tijd later rees het vermoeden dat deze stof op de een of andere manier de code van erfelijk materiaal bevatte.
Verschillende pogingen werden gedaan om de structuur van het molecuul te doorgronden en in 1953 werd deze ontdekt door James Watson en Francis Crick.
Het molecuul werd DNA genoemd:
Deoxyribonucleic Acid (De stof bleek zure eigenschappen te bezitten en zich voornamelijk in de kern te bevinden terwijl de suikergroep deoxyribose een belangrijk onderdeel van de structuur vormde).
Sinds de ontdekking van DNA is de genetica één van de belangrijkste takken van de biologie.
DNA bevat de erfelijke informatie van een organisme in de vorm van genen en is de basis van al het leven.
De genen in het molecuul coderen voor de eiwitten die het organisme nodig heeft.
Vanaf het moment dat Khorana, Holley en Nirenberg in 1968 de code van het DNA kraakten, werd het steeds interessanter om de basenvolgorde van het DNA te bepalen.
In de jaren ’70 ontwikkelde Frederick Sanger een methode die het
sequencen (aflezen van de basenvolgorde) van DNA mogelijk maakte.
Sindsdien is er op het gebied van DNA sequencing veel veranderd.
Technische ontwikkelingen maakten het automatiseren van het proces mogelijk, waardoor de techniek steeds gebruiksvriendelijker werd.
In de jaren ’90 werd begonnen met het
Human Genome Project, dat als doel had het hele menselijke genoom in kaart te brengen.
Van verschillende mensen – onder wie James Watson – werd het hele DNA gesequenced, dat nu als vergelijkingsmateriaal dient voor nieuw bepaalde volgorden van DNA fragmenten.
Inmiddels is er al sprake van een nieuwe generatie sequencingmethoden:
Next-Generation Sequencing, ook wel NGS. Verschillende bedrijven bieden volledig geautomatiseerde sequencingmethoden aan, die steeds goedkoper en sneller worden en steeds meer DNA kunnen sequencen.
Het is duidelijk dat DNA sequencing de afgelopen decennia een sterke ontwikkeling heeft doorgemaakt. De maatschappelijke impact van de techniek is groot. DNA sequencing kan worden gebruikt om het genoom van organismen te bepalen en zo onderzoek te doen naar eiwitten, maar speelt ook een grote rol in de geneeskunde. Met DNA sequencing kunnen erfelijke aandoeningen en mutaties opgespoord worden om zo een vergroot risico op een aandoening voor de patiënt voortijdig op te sporen of om een ziekte te diagnostiseren. DNA sequencing kan bovendien overtuigend bewijs leveren in juridische processen tegen verdachten van bepaalde misdrijven. DNA sequencing is niet meer weg te denken uit de moderne wetenschap.
Vraagstelling
Zijn er verbeteringen mogelijk in het nieuwe protocol van de Cuppen-groep (Universiteit Utrecht),
waarmee barcoded fragment libraries kunnen worden gemaakt voor multiplexed enrichment.
Hypothese
Omdat wij twee tamelijk onervaren laboranten zijn op het gebied van DNA Sequencing is er een grote kans dat wij tegen problemen aanlopen die meer ervaren laboranten niet meer hebben.
Op deze manier denken wij mee te kunnen helpen het protocol te verbeteren.
Theorie
In 1990 werd serieus gestart met DNA sequencing door het Human Genome Project.
Een menselijk genoom telt ongeveer 3,3 miljard basenparen.
In 2001 werd een eerste schets van de basenvolgorde van de mens gepubliceerd.
Om tot deze schets te komen is van minstens 100 individuen het genoom bepaald, een langdurig en kostbaar proces.
Het sequencen van 1 individu kostte 70 miljoen dollar.
In 2003 werd dit project afgerond met als één van de belangrijkste conclusies dat slechts 1,1 – 1,4% van het menselijk genoom voor eiwitten codeert.
DNA sequencing wordt vooral toegepast is de geneeskunde.
Van steeds meer ziektes is bekend welke genetische variatie ervoor verantwoordelijk is, zodat met DNA sequencing een diagnose kan worden gesteld.
Soms is ook bekend welke variatie in het DNA een verhoogd risico geeft op een ziekte.
Voor het vinden van daders en vaders volstaat over het algemeen de DNA fingerprinting techniek, in bijzondere gevallen wordt sequencing gebruikt.
Om DNA sequencing als techniek veelvuldig in de geneeskunde te kunnen gebruiken is het van belang dat het sneller en goedkoper kan.
Dat kan door alleen het gen te sequencen dat voor de bepaalde ziekte codeert, veel genen tegelijk te sequencen en het proces van sequencen steeds verder te automatiseren.
Dit wordt in de literatuur omschreven als Next-Generation Sequencing.
Om alleen het gen dat je nodig hebt te sequencen wordt eerst een DNA Libary gemaakt.
Dit betekent dat het DNA een groot aantal stappen van bewerking doorloopt voor het de sequencer in gaat.
Met deze bewerking wordt ervoor gezorgd dat de DNA fragmenten kort genoeg zijn voor de sequencer.
Afhankelijk van de techniek die de sequencer gebruikt varieert de afleeslengte van het DNA fragment dat kan worden gebruikt van 26 tot 330 basenparen.
In Utrecht worden sequencers met de SOLiD techniek gebruikt, die fragmenten tot 200 basenparen aan kan.
Een proces dat enrichment heet zorgt ervoor dat alleen het DNA van één gen wordt geselecteerd. Aan een DNA fragment kan een barcode worden gekoppeld.
Figuur 1: Een voorbeeld van een barcoded fragment libary
Het doel van een barcode is om efficiënter te kunnen werken. Een onderzoeker kan met 96 verschillende DNA samples tegelijk bezig zijn. Normaal zou hij deze samples allemaal apart moeten houden en alle stappen moeten doorlopen met 96 aparte reageerbuizen. Als hij echter libraries maakt met een barcode erin, kan hij elk sample een andere barcode geven en vervolgens alle samples bij elkaar in één reageerbuis voegen. Dit proces heet multiplexing. Als de libraries gesequenced zijn blijkt van elk fragment uit de barcode (die mee gesequenced wordt) uit welk sample het DNA gekomen is. Een computer kan met behulp van de barcode makkelijk de samples sorteren en van alle samples apart de basenvolgorde geven. Meerdere samples tegelijk bewerken bespaart veel geld. Enrichment is even duur voor 1 sample als voor meerdere samples tegelijk. Met de nieuwe methode kunnen tot 96 samples tegelijk behandeld worden. Aangezien elke enrichment procedure zo’n €400 kost, kunnen voor 96 samples de kosten van enrichment verlaagd worden van €38.400 naar €400 euro. Daarbij komt dat de procedure een stuk sneller gaat als de samples van tevoren samengevoegd kunnen worden.
Toen in 1990 werd gestart met DNA sequencing varieerden de kostprijs tussen de 1 en 10 dollar per 1000 basenparen, in 2010 kost het sequencen nog 0,04 dollar per 1000 basenparen. Dat betekent dat er nu vooral nog winst gehaald kan worden in de voorbereidende processen, bijvoorbeeld de kosten van de enrichment. Daarnaast stijgt het aantal basenparen dat per minuut bepaald kan worden ook explosief.
SOLiD is de afkorting van ‘Seqencing by Oligonucleotide Ligation and Detection’. Deze techniek werkt met het enzym ligase, terwijl veel andere technieken met DNA polymerase werken. Omdat iedere nucleotide twee keer achter elkaar wordt gemeten is de kans op fouten erg klein. Nadeel hiervan is dat het langzamer gaat dan bij andere technieken.
Na het sequencen van het DNA in de SOLiD sequencer is de basenvolgorde bekend van een groot aantal korte fragmenten. De volgorde waarin deze fragmenten oorspronkelijk op het DNA lagen is onbekend. Het verwerken van de SOLiD resultaten wordt een stuk makkelijker door het bestaan van referentiegenomen in online databases. In deze databases kunnen wetenschappers het genoom van een groot aantal organismen vinden. Het menselijk genoom is in kaart gebracht door de Human Genome Organisation, maar er zijn ook projecten die het genoom van andere organismen bekend hebben gemaakt. Na het sequencen stuurt de sequencer de resultaten door naar een computer. Een programma zoals de Burrows-Wheeler Aligner (BWA) is vervolgens in staat om de losse fragmenten met het referentiegenoom te vergelijken en zo de juiste basenvolgorde te achterhalen.
In afbeelding 2 is te zien hoe het programma werkt. Elk stukje DNA komt in meerdere libraries voor. Sommige basenparen in het DNA komen in heel weinig libraries voor (zoals de eerste C), anderen in veel meer (zoals de laatste A). Soms is er in één van de libraries een foutje gemaakt; dat is goed te zien op positie 20, waar in de meeste ‘reads’ een G staat maar er ook één T staat.
Figuur 2: De werking van de Burrows-Wheeler Aligner
Ook worden de referentiegenomen gebruikt om een mutatie te vinden. Het referentiegenoom kent de variaties die er zijn onder de bevolking. Als er in het DNA uit de sequencer een variatie is die volgens het referentiegenoom bij minder dan 10% van de bevolking voorkomt, wordt die positie door het programma rood aangegeven. In afbeelding 2 komt dat niet voor.
Materiaal en methode
We hebben het protocol met 2 DNA samples uitgevoerd om later te kunnen vergelijken.
- Stap 1: We maken een DNA oplossing van 2000 ng DNA opgelost in 100 microliter.
- Stap 2: Shearing: Door middel van ultrasound wordt het DNA in stukjes verdeeld.
- Stap 3: Ampure purification: DNA van tenminste 50 basenparen of langer wordt gescheiden van kleinere DNA fragmenten en alle reactiestoffen. Het resultaat is DNA van 50 of meer basenparen in een bufferoplossing.
- Stap 4: End-repair: Het breken van het DNA gebeurt niet ‘recht’. De DNA fragmenten zijn grotendeels dubbelstrengs, maar aan de uiteinden kunnen stukjes enkelstrengs DNA zitten. Via dit proces worden deze uiteinden ook weer dubbelstrengs gemaakt.
- Stap 5: Ligation: Met het enzym ligase worden er adaptors (P1 en Internal) aan het DNA fragment gekoppeld.
- Stap 6: Nogmaals ampure purification.
- Stap 7: Nick-translation + barcoding in PCR: Omdat de adaptors aan één kant geen fosfaatgroep hebben, zit er in het DNA fragment met de adaptors op twee plaatsen een gat (nick). Dit gat moet worden opgevuld. Als laatste wordt er dan een barcode met de P2 adaptor aan het fragment gekoppeld. Door PCR worden de fragmenten vermenigvuldigd.
- Stap 8: Nogmaals ampure purification. Het eindresultaat is een barcoded fragment library (zie afbeelding 1).
- Stap 9: Bioanalyzer: De DNA samples worden in de putjes op een DNA-chip geplaatst. Ieder putje heeft zijn eigen voeding en gel. De korte en daardoor lichtere DNA fragmenten bewegen sneller door de gel dan de grotere en daardoor zwaardere DNA fragmenten. De Bioanalyzer meet de lengte van de fragmenten en het aantal moleculen van deze lengte.
Resultaten
Sample 1 bevat na het doorlopen van het protocol geen DNA meer.
Nadat de eerste ronde was mislukt zijn we met sample 2 begonnen met een extra schoonmaakstap. Dit sample is daarna verdeeld in 2 subsamples. Na iedere stap uit het protocol is een concentratiemeting uitgevoerd.
Tabel 1: Concentratie en totale hoeveelheid DNA na elke stap uit het protocol
Bij het doorlopen van het protocol treedt er logischerwijs verlies van DNA op, met uitzondering van de PCR stap die de DNA fragmenten vermeerdert, zoals ook blijkt uit tabel 1. Nu worden deze subsamples in de bioanalyzer geplaatst om de fragmenten nauwkeuriger te bekijken.
Op de y-as van de grafiek staat een maat voor het aantal gevonden fragmenten.
Op de x-as is de lengte van het DNA in basenparen te zien.
Grafiek 1: Fragmentgrootte en hoeveelheid van DNA na shearing
Grafiek 2: Fragmentgrootte en hoeveelheid DNA na PCR
Uit grafiek 1 blijkt dat het DNA in stukken van 100 tot 150 basenparen is geknipt.
De top van de grafiek ligt op 116 basenparen. De meeste fragmenten zijn van de gewenste grootte.
Uit grafiek 2 blijkt dat de top van de grafiek hoger ligt, te verklaren doordat er na PCR meer fragmenten DNA zijn ontstaan.
Daarnaast zijn de DNA fragmenten langer geworden, dit komt door het toevoegen van adaptors en een barcode (die ook uit stukjes DNA bestaan).
Conclusie
Het protocol werkte aanvankelijk niet goed.
Op basis van de resultaten die de eerste keer werden behaald is er voor het protocol een extra schoonmaakstap toegevoegd, waarna het wel goed werkte.
Discussie
De eerste keer dat het protocol werd uitgevoerd bleek er na afloop geen DNA meer te zijn. Het gebruikte DNA was relatief oud. Als DNA te lang wordt bewaard valt het in stukjes uiteen. Dit DNA bestond waarschijnlijk alleen nog uit heel kleine stukjes die bij de stap Ampure purification werden weggewassen.
De tweede keer dat het protocol werd uitgevoerd was het resultaat naar verwachting. Bij de stap Ampure purification ging soms wel meer DNA verloren dan op basis van de theorie verwacht mocht worden. Dit kan twee oorzaken hebben; soms wordt per ongeluk goed DNA toch weggepipetteerd en soms binden ook de grotere fragmenten niet goed waardoor deze deels toch verloren gaan.
Het proces van shearing heeft een zekere onnauwkeurigheid. Kleine verschillen in de geluidsfrequentie, de temperatuur en de tijdsduur hebben allemaal invloed op de hoeveelheid en de grootte van de DNA fragmenten.
De extra schoonmaakstap bleek bij onze experimenten een verbetering van het protocol, hoewel er meerdere experimenten gewenst zijn om dit definitief te bevestigen.