IL DNA

L'acido desossiribonucleico o deossiribonucleico (DNA) è un acido nucleico che contiene le informazioni genetiche necessarie alla biosintesi di RNA e proteine, molecole indispensabili per lo sviluppo ed il corretto funzionamento della maggior parte degli organismi viventi.^[1]

Dal punto di vista chimico, il DNA è un polimero organico costituito da monomeri chiamati nucleotidi. Tutti i nucleotidi sono costituiti da tre componenti fondamentali: un gruppo fosfato, il deossiribosio (zucchero pentoso) e una base azotata che si lega al deossiribosio con legame N-glicosidico. Quattro sono le basi azotate che possono essere utilizzate nella formazione dei nucleotidi da incorporare nella molecola di DNA: adenina, guanina, citosina e timina.

La disposizione in sequenza di queste quattro basi costituisce l'informazione genetica, leggibile attraverso il codice genetico, che ne permette la traduzione in amminoacidi. Il processo di traduzione genetica (comunemente chiamata sintesi proteica) è possibile solo in presenza di una molecola intermedia di RNA, generata attraverso la trascrizione del DNA. Tale processo non genera solo filamenti di RNA destinati alla traduzione, ma anche frammenti già in grado di svolgere svariate funzioni biologiche (ad esempio all'interno dei ribosomi, dove l'RNA ha una funzione strutturale). L'informazione genetica è duplicata prima della divisione cellulare, attraverso un processo noto come replicazione del DNA, che evita che si perda informazione durante le generazioni.

Negli eucarioti, il DNA si complessa all'interno del nucleo in strutture chiamate cromosomi. Negli altri organismi, privi di nucleo, esso può essere organizzato in cromosomi o meno. All'interno dei cromosomi, le proteine della cromatina (come gli istoni) permettono di compattare e controllare la trascrizione dei geni,almeno nella maggior parte dei casi.

Indice

· 1 Storia

· 2 Composizione

o 2.1 Appaiamento delle basi

o 2.2 Senso e antisenso

o 2.3 Superavvolgimento

o 2.4 Strutture alternative a doppia elica

o 2.5 Strutture alternative alla doppia elica

· 3 Modificazioni chimiche

o 3.1 Modificazioni di basi

o 3.2 Danni al DNA

· 4 Disposizione del DNA

o 4.1 Procarioti

o 4.2 Eucarioti

· 5 Funzioni biologiche

o 5.1 Struttura del genoma

o 5.2 Trascrizione e traduzione

§ 5.2.1 Il codice genetico

o 5.3 Replicazione

· 6 Interazioni con proteine

o 6.1 Proteine che legano il DNA

o 6.2 Enzimi che modificano il DNA

§ 6.2.1 Nucleasi e ligasi

§ 6.2.2 Topoisomerasi ed elicasi

§ 6.2.3 Polimerasi

· 7 Ricombinazione genetica

· 8 Evoluzione del metabolismo del DNA

· 9 Utilizzi del DNA

o 9.1 Ingegneria genetica

o 9.2 Medicina forense

o 9.3 Bioinformatica

o 9.4 DNA in informatica e nanotecnologie

o 9.5 Storia e antropologia

· 10 Note

· 11 Voci correlate

· 12 Altri progetti

· 13 Collegamenti esterni

Storia

Francis Crick

Il DNA fu inizialmente isolato dal biochimico svizzero Friedrich Miescher che, nel 1869, individuò una sostanza microscopica contenuta nel pus di bende chirurgiche utilizzate. Dal momento che tale molecola aveva la sua localizzazione nel nucleo, egli la chiamò nucleina.^[2] Nel 1919 Phoebus Levene individuò la struttura del nucleotide, composta da base azotata, zucchero e fosfato.^[3] Levene suggerì che il DNA consistesse di un filamento di nucleotidi legati tra loro attraverso i fosfati. In ogni caso, Levene era convinto che tale filamento fosse corto e che le basi fossero disposte secondo un preciso ordine ripetuto. Nel 1937 William Astbury presentò i primi risultati di alcuni studi di diffrazione a raggi X, che dimostrarono che il DNA ha una struttura estremamente regolare.^[4]

Nel 1928, Frederick Griffith scoprì che i caratteri della forma smooth, ("liscia") di Pneumococcus potevano essere trasferiti alla forma rough ("rugosa") miscelando i resti di batteri smooth morti con batteri rough vivi.^[5] Questo sistema, pur non fornendo nessuna evidenza su quale fosse la sostanza che determinava il cambiamento, mostrava comunque che qualcosa potesse trasportare l'informazione genetica dai resti dei batteri morti a quelli vivi. Si parlò quindi di un principio trasformante in grado di modificare i batteri vivi. Nel 1943 Oswald Theodore Avery dimostrò, in un celebre esperimento insieme a Colin MacLeod e Maclyn McCarty, che il DNA è il principio trasformante alla base di questo fenomeno.^[6] Il ruolo del DNA nell'ereditarietà è stato dimostrato infine nel 1953 da Alfred Hershey e Martha Chase attraverso un altro classico esperimento, che dimostrò che il materiale genetico del fago T2 è effettivamente il DNA.^[7]

Il 1953 è anche l'anno in cui, attraverso ulteriori immagini da diffrazione a raggi X^[8] realizzate da Rosalind Franklin, chimica-fisica inglese, James Watson e Francis Crick presentarono^[8] sulla rivista Nature quello che è oggi accertato come il primo modello accurato della struttura del DNA,^[9] quello della doppia elica. A disegnarne il bozzetto fu Odile Speed, pittrice e moglie di Crick. Le evidenze sperimentali a supporto del modello di Watson e Crick furono riportate in una serie di cinque articoli pubblicati sullo stesso numero di Nature.^[10] Tra questi figurava l'articolo della Franklin e di Raymond Gosling, che conteneva i dati di diffrazione a raggi X fondamentali per sostenere il modello.^[11][12] Tale numero conteneva anche un articolo sulla struttura del DNA scritto da Maurice Wilkins.^[13] Nel 1962, dopo la morte di Rosalind Franklin (a causa di un tumore provocato, probabilmente, dalle alte dosi di raggi X a cui si era esposta nel corso dei suoi esperimenti), Watson, Crick e Wilkins ricevettero congiuntamente il Premio Nobel per la medicina.^[14] Dal momento che la scoperta del modello si basò essenzialmente sui dati di Rosalind Franklin, ancora oggi esistono pareri molto eterogenei nella comunità scientifica su chi avrebbe dovuto ricevere tale premio.

In una importante presentazione del 1957, Crick propose il dogma centrale della biologia molecolare, che fissa le relazioni tra DNA, RNA e proteine.^[15] La conferma finale del meccanismo di replicazione basato sulla struttura a doppia elica fu fornita nel 1958 dall'esperimento di Meselson-Stahl.^[16] Un successivo lavoro di Crick dimostrò come il codice genetico fosse basato su triplette di basi non sovrapposte, permettendo ad Har Gobind Khorana, Robert Holley e Marshall Warren Nirenberg di decifrarlo.^[17] Queste scoperte sono alla base della moderna biologia molecolare.

Nel 1961 Marshall Nirenberg e Severo Ochoa scoprono che ogni tripletta di nucleotidi codifica per uno specifico amminoacido.

Nel 1986 Renato Dulbecco propone di decifrare il codice genetico dell'uomo per sconfiggere il cancro.

Composizione

Animazione di un frammento di DNA. Visibili il solco maggiore ed il solco minore.

Il DNA è un lungo polimero costituito da unità ripetute di nucleotidi.^[18][19] La catena del DNA è larga tra i 22 ed i 26 Ångström (da 2,2 a 2,6 nanometri) ed ogni unità nucleotidica è lunga 3,3 Ångstrom (0,33 nanometri).^[20] Sebbene ogni unità occupi uno spazio decisamente ridotto, la lunghezza dei polimeri di DNA può essere sorprendentemente elevata, dal momento che ogni filamento può contenere diversi milioni di nucleotidi. Ad esempio, il più grande cromosoma umano (il cromosoma 1) contiene quasi 250 milioni di paia di basi.^[21]

Negli organismi viventi, il DNA non è quasi mai presente sotto forma di singolo filamento, ma come una coppia di filamenti saldamente associati tra loro.^[9][22] Essi si intrecciano tra loro a formare una struttura definita doppia elica. Ogni nucleotide è costituito da uno scheletro laterale, che ne permette il legame covalente con i nucleotidi adiacenti, e da una base azotata, che instaura legami idrogeno con la corrispondente base azotata presente sul filamento opposto. Il composto formato da una base azotata legata allo zucchero è definito nucleoside; un nucleotide è invece un nucleoside a cui sono legati uno o più gruppi fosfato.^[23]

La struttura laterale del DNA è composta da unità ripetute ed alternate di gruppi fosfato e di 2-deossiribosio,^[24] uno zucchero pentoso (a cinque atomi di carbonio) che si lega ai fosfati adiacenti attraverso legami fosfodiesterici presso il terzo ed il quinto carbonio; in pratica, ogni molecola di fosfato forma un ponte molecolare collegando, attraverso legami fosfodiesterici, il carbonio in posizione 3′ di una molecola di deossiribosio con quello in posizione 5′ dello zucchero successivo. Conseguenza di questi legami asimmetrici è che ogni filamento di DNA ha un senso, determinato dalla direzione dei legami fosfodiesterici. In una doppia elica, il senso di un filamento è opposto a quello del filamento complementare. Per tale motivo, i due filamenti che costituiscono una doppia elica sono detti antiparalleli. Le estremità asimmetriche di un filamento di DNA sono definite estremità 5′ (cinque primo) ed estremità 3′ (tre primo). La principale differenza tra il DNA e l'RNA è lo zucchero pentoso utilizzato: l'RNA utilizza, infatti, il ribosio.^[22]

La doppia elica del DNA è stabilizzata dai legami idrogeno che si instaurano tra le basi azotate presenti sui due filamenti. Le quattro basi che sono state individuate nel DNA sono l'adenina (abbreviata con la lettera A), la citosina (C), la guanina (G) e la timina (T). Adenina e guanina sono composti eterociclici chiamati purine, mentre citosina e timina sono anelli pirimidinici.^[22] Esiste una quinta base, di tipo pirimidinico, chiamata uracile (U), ma essa non è di norma presente nelle catene di DNA. L'uracile è altresì presente nei filamenti di RNA al posto della timina, da cui si differenzia per la mancanza di un gruppo metile. L'uracile è presente nel DNA solo come prodotto della degradazione della citosina. Solo nel batteriofago PBS1 tale base può essere utilizzata all'interno del DNA.^[25] Al contrario, è molto più frequente individuare la timina all'interno di molecole di RNA, a causa della metilazione enzimatica di diversi uracili. Questo evento avviene solitamente a carico di RNA con funzione strutturale o enzimatica (rRNA

e tRNA).^[26]

La doppia elica è una spirale destrorsa. Con l'avvitarsi su sé stessi dei due filamenti, restano esposti dei solchi tra i diversi gruppi fosfato. Il solco maggiore è largo 22 Å, mentre il solco minore è largo 12 Å.^[27] La differente ampiezza dei due solchi si traduce concretamente in una differente accessibilità delle basi, a seconda che si trovino nel solco maggiore o minore. Proteine come i fattori di trascrizione, dunque, solitamente prendono contatto con le basi presenti nel solco maggiore.^[28][29]

Appaiamento delle basi

In alto, un appaiamento GC, caratterizzato da tre legami idrogeno. In basso, un appaiamento AT con due legami idrogeno.

Ogni tipo di base presente su un filamento forma un legame con la base posta sul filamento opposto. Tale evento è noto come appaiamento complementare. Le basi puriniche formano legami idrogeno con le basi pirimidiniche: A può legare solo T e G può legare solo C. L'associazione di due basi viene comunemente chiamata paio di basi ed è l'unità di misura maggiormente utilizzata per definire la lunghezza di una molecola di DNA. Dal momento che i legami idrogeno non sono covalenti, essi possono esser rotti e riuniti in modo relativamente semplice. I due filamenti possono essere allontanati tra loro, come avviene per una cerniera, sia dalle alte temperature che da un'azione meccanica (come avviene durante la replicazione del DNA).^[30] Conseguenza di questa complementarità è che tutte le informazioni contenute nella doppia elica possono essere duplicate a partire da entrambi i filamenti, evento fondamentale per una corretta replicazione del DNA.^[18]

I due tipi di paia di basi formano un numero differente di legami idrogeno: A e T ne formano due, G e C tre. Per tale motivo, la stabilità del legame GC è decisamente maggiore di quello AT. Di conseguenza, la stabilità complessiva di una molecola di DNA è direttamente correlata alla frequenza di GC presenti nella molecola stessa, nonché alla lunghezza dell'elica: una molecola di DNA è dunque tanto più stabile quanto più contiene GC ed è lunga.^[31] Un'altra conseguenza di tale evento è il fatto che le regioni di DNA che devono essere separate facilmente contengono un'elevata concentrazione di A e T, come avviene ad esempio per il Pribnow box dei promotori batterici, la cui sequenza è infatti TATAAT.^[32]

In laboratorio, la stabilità dell'interazione tra filamenti è misurata attraverso la temperatura necessaria a rompere tutti i legami idrogeno, chiamata temperatura di melting (o T_m). Quando tutti i legami idrogeno sono rotti, i singoli filamenti si separano e possono assumere strutture molto variegate.^[33]

La stabilizzazione della doppia elica, in ogni caso, non è dovuta ai soli legami idrogeno, ma anche ad interazioni idrofobiche e di pi stacking.^[34]

Senso e antisenso

Una sequenza di DNA è definita senso se la sua sequenza è la stessa del relativo mRNA. La sequenza posta sul filamento opposto è invece detta antisenso. Dal momento che le RNA polimerasi lavorano producendo una copia complementare, il filamento necessario per la trascrizione è l'antisenso. Sia nei procarioti che negli eucarioti vengono prodotte numerose molecole di RNA antisenso a partire dalle sequenze senso. La funzione di questi RNA non codificanti non è stata ancora completamente chiarita.^[35] Si ritiene che gli RNA antisenso possano giocare un ruolo nella regolazione dell'espressione genica.^[36]

Esistono alcune sequenze di DNA, sia in procarioti che in eucarioti (ma soprattutto nei plasmidi e nei virus) in cui la differenza tra sequenze senso ed antisenso è meno chiara, dal momento che le sequenze di alcuni geni si sovrappongono tra loro.^[37] In questi casi, dunque, alcune sequenze rivestono un doppio compito: codificare una proteina se lette in direzione 5'→3′ su un filamento; codificarne un'altra se lette sull'altro (sempre in direzione 5'→3′). Nei batteri, questa sovrapposizione genica è spesso coinvolta nella regolazione della trascrizione,^[38] mentre nei virus il fenomeno è dovuto alla necessità di contenere in un piccolo genoma un'elevata quantità di informazioni.^[39] Un altro modo di ridurre le dimensioni genomiche è quello individuato da altri virus, che contengono molecole di DNA lineare o circolare a singolo filamento.^[40][41]

Superavvolgimento

Il DNA può essere distorto come avviene per una corda attraverso un processo definito superavvolgimento. Quando il DNA è in uno stato rilassato, un filamento percorre un giro completo intorno all'asse ogni 10.4 paia di basi. Se invece il DNA è distorto, il numero di basi può aumentare o diminuire.^[42] Lo stato di superavvolgimento in cui si trova una molecola di DNA è definito topologia. Se il DNA si avvolge nella direzione dell'elica, si parla di superavvolgimento positivo, con le basi strette tra loro in modo più marcato. In caso contrario, si parla di superavvolgimento negativo. In natura, la maggior parte delle molecole di DNA presentano un lieve superavvolgimento negativo, introdotto da enzimi definiti topoisomerasi.^[43] Questi enzimi sono anche necessari in processi come la trascrizione e la replicazione del DNA, dal momento che sono in grado di risolvere gli stress topologici indotti dai processi stessi.^[44]

Strutture alternative a doppia elica

Le strutture del DNA A, B e Z

Il DNA esiste in diversi tipi di conformazioni. Esse sono denominate A-DNA, B-DNA, C-DNA, D-DNA,^[45] E-DNA,^[46] H-DNA,^[47] L-DNA,^[45] P-DNA^[48] e Z-DNA.^[24][49] In ogni caso, solo le conformazioni A-DNA, B-DNA e Z-DNA sono state osservate nei sistemi biologici naturali. La conformazione del DNA può dipendere dalla sequenza, dal superavvolgimento, dalla presenza di modificazioni chimiche delle basi o dalle condizioni del solvente, come la concentrazione di ioni metallici.^[50] Di tali conformazioni, la conformazione B è la più frequente nelle condizioni standard delle cellule.^[51] Le due conformazioni alternative sono differenti dal punto di vista della geometria e delle dimensioni.

La forma A è un'ampia spirale destrorsa (il solco minore è largo ma poco profondo, quello maggiore è più stretto e profondo), con un passo di 2,9 nm (circa 11bp) ed un diametro di 2,5 nm. Tale conformazione è presente in condizioni non fisiologiche, quando il DNA viene disidratato. In condizioni fisiologiche, questa conformazione caratterizza gli eteroduplex di DNA e RNA e i complessi formati dalle associazioni DNA-proteina.^[52][53]

La conformazione Z è tipica invece delle sequenze che presentano modificazioni chimiche come la metilazione, e dei tratti di DNA ricchi di basi C e G. Essa assume un andamento sinistrorso, opposto rispetto alla conformazione B.^[54] Ha un passo di 4,6 nm ed un diametro di 1,8 nm, il solco maggiore più superficiale e quello minore più stretto; deve il suo nome all'andamento a zig-zag che la caratterizza. Queste strutture inusuali possono essere riconosciute da specifiche Z-DNA-binding proteins

, con conseguenze notevoli nella regolazione della trascrizione.^[55]

La struttura di un quadruplex di DNA formato da ripetizioni di telomeri. La conformazione dello scheletro laterale è ampiamente differente rispetto alla tipica struttura ad elica. In giallo sono evidenziati ioni potassio che stabilizzano la struttura.^[56]

Strutture alternative alla doppia elica

Le regioni terminali dei cromosomi lineari sono sequenze ripetute dette telomeri. La funzione principale di tali regioni è quella di permettere alla cellula di replicare le estremità dei cromosomi senza che ci sia perdita di informazioni geniche, dal momento che le DNA polimerasi coinvolte nella replicazione del DNA non sono in grado di replicare le estremità 3' dei cromosomi.^[57] Se un cromosoma non avesse telomeri, infatti, diventerebbe un po' più corto ad ogni replicazione, con il rischio di perdere sequenze codificanti. Attraverso un particolare tipo di DNA polimerasi (detto telomerasi), invece, i telomeri mantengono costantemente la loro lunghezza, proteggendo così la parte interna del cromosoma. Nelle cellule umane, i telomeri sono composti da alcune migliaia di ripetizioni di una semplice sequenza costituita da TTAGGG.^[58]

Questa sequenza ricca in guanina può stabilizzare le estremità dei cromosomi formando strutture insolite, composte da unità di quattro basi azotate al posto delle canoniche due. Ciò è dovuto all'interazione tra quattro guanine, che formano una struttura planare che si impila sopra ad altre strutture dello stesso tipo, ad ottenere un filamento stabile definito G-quadruplex structure.^[59] Tali strutture sono stabilizzate dalla formazione di legami idrogeno che si instaurano tra le sommità delle basi e dalla chelazione con uno ione metallico, situato al centro di ogni unità di quattro basi.^[60]

Oltre a queste, i telomeri generano anche strutture circolari, chiamate telomere-loops o T-loops. In questo caso, il singolo filamento di DNA si piega a formare ampie circonferenze, stabilizzate da proteine specifiche che legano i telomeri.^[61] Al termine del T-loop, il singolo filamento di DNA prende contatto con un doppio filamento, che si apre e forma una struttura a tripla elica. Questa struttura è chiamata displacement-loop o D-loop.^[59] La sua struttura è stata paragonata ad una lunghissima scala a pioli attorcigliata su se stessa e composta da due montanti (filamenti costituiti da molecole di acido fosforico e di desossiribosio) e da tanti gradini ( formati da quattro composti, detti basi azotate: adenina, guanina, citosina e timina). Le basi azotate si legano secondo una regola ben precisa: -L’adenina si lega solamente con la timina. -La guanina si lega esclusivamente con la citosina. Si dice perciò che le basi azotate adenina-timina e guanina-citosina sono complementari. L’insieme di acido fosforico + zucchero desossiribosio + base azotata costituisce l’unità di base del DNA: questo insieme è detto nucleotide e si ripete in ciascun filamento per tutta la sua lunghezza. Ogni essere vivente possiede il proprio DNA, che contiene tutte le informazioni genetiche necessarie per controllare le attività dell’organismo. La particolare struttura del DNA ne consente di duplicarsi e, quindi di sostituire eventuali parti mancanti perfettamente uguali all’originale…ciò, avviene durante l’interfase quando i cromosomi sono dispersi nel nucleo e gli danno l’opportunità di duplicarsi. La formazione delle proteine, detta sintesi delle proteine o traduzione , avviene nel citoplasma e segue delle fasi ben precise: - il DNA nel nucleo fa da stampo per la formazione dell’ RNA messaggero, mediante un processo chiamato Trascrizione che è un meccanismo simile a quello della duplicazione. In questo modo, la sequenza dei nucleotidi nel mRNA risulta complementare a quella del DNA con la base U al posto della base T.

Modificazioni chimiche


citosina	5-metilcitosina	timina

Struttura della citosina con e senza il gruppo metile in posizione 5. In seguito ad una deaminazione, la 5-metilcitosina acquisisce la stessa struttura della timina

Modificazioni di basi

L'espressione genica di un determinato locus è influenzata dalla struttura che la cromatina assume presso il locus stesso. Regioni eterocromatiniche (caratterizzate da una espressione scarsa o assente) sono estesamente metilate sulle citosine. La metilazione della citosina, ad esempio, è fondamentale per l'inattivazione del cromosoma X.^[62] Il livello medio di metilazione è molto variabile tra i diversi organismi: Caenorhabditis elegans non presenta metilazione delle citosine, mentre i vertebrati mostrano livelli maggiori, con circa l'1% del genoma contenente 5-metilcitosina.^[63] La 5-metilcitosina, essendo suscettibile di deaminazione spontanea, è una base presso cui l'incidenza di mutazioni è elevatissima.^[64] Ulteriori modificazioni di basi sono la metilazione dell'adenina (presente nei batteri) e la glicosilazione dell'uracile che produce le cosiddette basi J nei cinetoplastidi.^[65][66]

Danni al DNA

Il benzopirene è il maggiore agente mutageno presente nel fumo di tabacco. In quest'immagine è riportato un addotto al DNA generato dalla molecola.^[67]

Il DNA può essere alterato dall'azione di numerosi agenti, genericamente definiti mutageni; è fondamentale notare però come una mutazione -ovverosia un cambiamento raro, casuale, che alteri la sequenza di basi azotate- non sia necessariamente un evento pernicioso ma anzi sia alla base dell'evoluzione: suddetta mutazione dovrà però farsi spazio nella fittissima rete cibernetica cellulare nonché nell'ambiente nel quale vive ed opera l'organismo vivente in questione; qualora vengano superati questi punti di restrizione (altamente selettivi vista la loro complessità intrinseca, la stragrande maggioranza delle mutazioni difatti si rivela non vantaggiosa od anche neutra), si avrà un organismo arricchito dalla mutazione. Tra di essi figurano ad esempio agenti ossidanti, agenti alchilanti ed anche radiazioni ad alta energia, come i raggi X e gli UV. Il tipo di danno causato al DNA dipende dal tipo di agente: gli UV, ad esempio, danneggiano il DNA generando la formazione di dimeri di timina, costituiti da ponti aberranti che si instaurano tra basi pirimidiniche adiacenti.^[68] Agenti ossidanti come i radicali liberi o il perossido di idrogeno, invece, producono danni di tipo più eterogeneo, come modificazioni di basi (in particolare di guanine) o rotture del DNA a doppio filamento.^[69] Secondo diversi studi, in ogni cellula umana almeno 500 basi al giorno sono sottoposte a danni ossidativi.^[70][71] Di tali lesioni, le più pericolose sono le rotture a doppio filamento, dal momento che tali danni sono i più difficili da riparare e costituiscono l'origine primaria delle mutazioni puntiformi e frameshift che si accumulano sulle sequenze genomiche, nonché delle traslocazioni cromosomiche.^[72]

Molti agenti devono il loro potere mutageno alla capacità di intercalarsi tra due basi azotate consecutive. Gli intercalanti sono tipicamente molecole planari e aromatiche, come l'etidio

, la daunomicina, la doxorubicina o la talidomide. Perché un intercalante possa trovare posto tra le due basi, occorre che la doppia elica si apra e perda la sua conformazione standard. Tali modifiche strutturali inibiscono sia la trascrizione che la replicazione del DNA ed aumentano la possibilità di insorgenza di mutazioni. Per tale motivo, gli intercalanti sono considerati molecole cancerogene, come dimostrato da numerosi studi su molecole come il benzopirene, l'acridina, l'aflatossina ed il bromuro di etidio.^[73][74][75] In ogni caso, proprio grazie alla loro capacità di inibire trascrizione e replicazione, tali molecole sono anche utilizzate in chemioterapia per inibire le cellule neoplastiche a rapida crescita.^[76]

Disposizione del DNA

L'avvolgimento del DNA (in rosa) attorno agli istoni (in blu)

Negli eucarioti, il DNA è solitamente presente all'interno di cromosomi lineari (circolari nei procarioti). La somma di tutti i cromosomi di una cellula ne costituisce il genoma; il genoma umano conta circa 3 miliardi di paia di basi contenute in 46 cromosomi.^[77]

La disposizione finale a cromosomi segue precise regole gerarchiche di impacchettamento. Nelle cellule, infatti, il doppio filamento di DNA non può essere disposto a casaccio, ma deve seguire precise regole di ordinamento. Tali accorgimenti si rivelano necessari perché la lunghezza dei filamenti di DNA è solitamente molto elevata e creerebbe seri problemi alla cellula ospite. Ad esempio, il cromosoma di Escherichia coli, il procariote più studiato nella storia della biomedicina, misura circa 1 mm. In una cellula lunga solo 2 μm, come quella di E.coli, la disposizione casuale di un cromosoma del genere potrebbe generare problemi. Se una molecola di questa lunghezza si disponesse casualmente, infatti, ci sarebbe bisogno di una cellula grande almeno 1000 volte tanto. Le modalità di impacchettamento sono differenti tra gli organismi procarioti e quelli eucarioti.

Procarioti

Nella maggior parte delle cellule batteriche il DNA è disposto su un unico cromosoma circolare (e presenta, come molti altri batteri, un'unica origine di replicazione), come previsto da numerosi esperimenti di linkage ed infine evidenziato in cellule cresciute con timina marcata con tritio.

I meccanismi messi in atto dalla cellula procariote per ridurre lo spazio necessario consistono anzitutto nel mascheramento delle cariche negative presenti sul DNA attraverso la sua associazione con poliammine cariche positivamente, come la spermina e la spermidina. Oltre a queste, il DNA procariote prende contatto anche con numerose piccole proteine, che compattano la struttura complessiva del DNA. Tra di esse, figura H-NS, un dimero con funzioni molto simili agli istoni eucariotici. In ogni cellula di E.coli esistono in media 20000 molecole di H-NS, che si dispongono lungo il DNA a distanza di circa 400bp.

Il DNA di E.coli è inoltre molto superavvolto. Tale fenomeno contribuisce ulteriormente al compattamento del DNA, permettendo ad esso di disporsi comodamente all'interno della cellula.

Eucarioti

Negli eucarioti l'impacchettamento è ottenuto attraverso diversi accorgimenti. Il DNA è associato ad un gran numero di proteine: l'associazione complessiva DNA-proteine è definita cromatina, la cui struttura è ampiamente conservata tra tutti gli organismi eucarioti.

Le proteine cromatiniche più abbondanti sono gli istoni, una famiglia di polipeptidi basici presenti nel nucleo. Le principali proteine istoniche sono H1, H2A, H2B, H3 e H4. La basicità degli istoni è dovuta alla grande quantità di amminoacidi carichi positivamente (lisina e arginina), in grado di instaurare interazioni elettrostatiche con i gruppi fosfato del DNA. Le proteine istoniche sono anche pesantemente modificate, proprio sui residui carichi, da modificazioni post-traduzionali, tra cui l'aggiunta di acetili, di fosfati e di metili, che neutralizzano la carica positiva o la rendono negativa.

Le sequenze amminoacidiche di quattro dei cinque istoni (H2A, H2B, H3 e H4) sono altamente conservate, anche tra specie molto diverse. La sequenza di H1 presenta invece maggiori variazioni lungo l'evoluzione: in alcuni organismi, H1 non è nemmeno presente in tutti i tessuti (ad esempio negli eritrociti degli uccelli H1 è sostituita da un sesto istone, chiamato H5). La presenza di differenti H1, in ogni caso, non modifica sostanzialmente la struttura complessiva dell'apparato istonico (definito nucleosoma), che resta ampiamente conservato nell'architettura nella quasi totalità degli eucarioti.

Funzioni biologiche

Nel genoma, l'informazione è conservata in sequenze di DNA chiamate geni. La trasmissione dell'informazione contenuta nei geni è garantita dalla presenza di sequenze di basi azotate complementari. Infatti, durante la trascrizione, l'informazione può essere facilmente copiata in un filamento complementare di RNA. Solitamente, tale copia di RNA è utilizzata per sintetizzare una proteina, attraverso un processo definito traduzione (o sintesi proteica). In alternativa, una cellula può semplicemente duplicare l'informazione genetica attraverso un processo definito replicazione del DNA.

Struttura del genoma

Negli organismi eucarioti, il DNA genomico è localizzato all'interno del nucleo cellulare, nonché in piccole quantità all'interno di mitocondri e cloroplasti. Nei procarioti, il DNA è invece racchiuso in un organello irregolare, privo di membrana, contenuto nel citoplasma, chiamato nucleoide.^[78] L'informazione è contenuta all'interno dei geni, unità ereditarie in grado di influire sul fenotipo dell'organismo. Ogni gene contiene un open reading frame (regione in grado di essere trascritta a RNA) ed una regione regolatoria, costituita sia da un promotore che da enhancers.

In molte specie, solo una piccola frazione della sequenza totale di un genoma può essere trascritta e tradotta. Ad esempio, solo l'1.5% del genoma umano è costituito da esoni codificanti una proteina, mentre più del 50% consiste di sequenze ripetute di DNA non codificante.^[79] La ragione per cui ci sia una tale quantità di DNA non codificante non è tuttora completamente chiara ed è stata definita come enigma del C-value.^[80] In ogni caso, le sequenze di DNA che non codificano una proteina possono essere trascritte in RNA non codificante, coinvolto nella regolazione dell'espressione genica.^[81]

Una T7 RNA polimerasi (blu) mentre produce una molecola di mRNA (verde) a partire da uno stampo di DNA (arancione).^[82]

Alcune sequenze non codificanti ricoprono un ruolo strutturale per i cromosomi. Le regioni telomeriche e centromeriche contengono solitamente pochissimi geni, ma sono necessarie per la funzione e la stabilità dei cromosomi.^[83] Nell'uomo, grandi quantità di DNA non codificante si ritrovano negli pseudogeni, copie di geni rese inattive dalla presenza di una mutazione.^[84] Queste sequenze sono considerate come fossili molecolari, anche se esistono evidenze secondo le quali si può ipotizzare che siano una sorta di materiale grezzo necessario per la creazione di nuovi geni attraverso i processi di duplicazione genica e di evoluzione divergente.^[85]

Trascrizione e traduzione

Un gene è una sequenza di DNA che contiene le informazioni in grado di influire sulle caratteristiche del fenotipo dell'organismo. All'interno di un gene, la sequenza di basi di DNA è utilizzata come stampo per la sintesi di una molecola di RNA che, nella maggior parte dei casi, è tradotta in una molecola peptidica.

Il meccanismo attraverso il quale la sequenza nucleotidica di un gene è copiata in un filamento di RNA è detto trascrizione ed avviene per mezzo dell'enzima RNA polimerasi. Il filamento di RNA può andare incontro a destini differenti: alcune molecole di RNA hanno, infatti, funzioni di tipo strutturale (come quelle che si trovano all'interno del ribosoma) o catalitica (molecole note come ribozimi); la maggior parte degli RNA, tuttavia, subiscono un processo di maturazione per produrre mRNA, molecole destinate ad esser tradotte in proteina.

Il processo di traduzione avviene nel citoplasma, dove gli mRNA si associano ai ribosomi, ed è mediato dal codice genetico. Il ribosoma permette la lettura sequenziale dei codoni del mRNA, favorendone il riconoscimento e l'interazione con specifici tRNA, molecole che trasportano gli amminoacidi corrispondenti ad ogni singolo codone.

Il codice genetico

Complementarietà delle basi azotate del DNA vista in dettaglio.

Il codice genetico consiste di parole di tre lettere chiamate codoni, costituite dalla sequenza di tre nucleotidi (ad esempio ACU, CAG, UUU), ognuna delle quali è associata ad un particolare amminoacido. Ad esempio la timina ripetuta in una serie di tre (UUU) codifica la fenilalanina. Utilizzando gruppi di tre lettere si possono avere fino a 64 combinazioni diverse (4³), in grado di codificare i venti diversi amminoacidi esistenti. Poiché esistono 64 triplette possibili e solo 20 amminoacidi, il codice genetico è detto ridondante (o degenere): alcuni amminoacidi possono infatti essere codificati da più triplette diverse. Non è invece vero il contrario: ad ogni tripletta corrisponderà un solo amminoacido (senza possibilità di ambiguità). Esistono infine tre triplette che non codificano alcun amminoacido, ma rappresentano codoni di stop (o nonsense), ovvero indicano il punto in cui, all'interno del gene, termina la sequenza che codifica la proteina corrispondente: si tratta dei codoni UAA, UGA e UAG.

La replicazione del DNA. La doppia elica è aperta dalle elicasi e dalle topoisomerasi. In seguito, una DNA polimerasi genera un filamento complementare sul filamento veloce. Un'altra DNA polimerasi lega invece il filamento lento, generando segmenti discontinui (detti frammenti di Okazaki) che verranno uniti da una DNA ligasi

Replicazione

La divisione cellulare, necessaria ad un organismo per crescere, richiede una duplicazione del DNA cellulare, in modo che le cellule figlie possano avere la stessa informazione genetica della cellula madre. La struttura a doppia elica del DNA permette un meccanismo estremamente semplice per la replicazione del DNA. I due filamenti, infatti, sono separati e da ognuno viene creato un filamento complementare, ad opera di un enzima chiamato DNA polimerasi. Con questo meccanismo, le basi presenti sul filamento figlio sono determinate da quelle presenti sul filamento parentale: è proprio attraverso questo meccanismo che le cellule figlie presentano genoma identico alla cellula madre (salvo errori avvenuti durante il processo, che portano alla comparsa di mutazioni). Tale tipo di replicazione, che porta a doppie eliche costituite da un filamento preesistente e uno neoformato è detta semiconservativa.

Per iniziare la replicazione, occorre anzitutto l'apertura della forca replicativa, attraverso la parziale denaturazione del DNA a doppia elica, portata a termine dalle elicasi e dalle single-strand-binding proteins (SSBPs): le elicasi sono enzimi che separano attivamente i due filamenti usando l'energia dell'ATP; le SSBPs sono in grado di mantenere la denaturazione del DNA legandosi esclusivamente alle porzioni a singolo filamento e stabilizzandole. Nelle molecole di DNA circolari dei procarioti si ha una sola regione di origine della replicazione dalla quale partono due forche replicative (la struttura prende il nome di bolla di replicazione). Quando le due forche si incontrano dal lato opposto la replicazione è completata. Negli eucarioti la replicazione di ogni cromosoma inizia invece in più punti.

Le DNA polimerasi, enzimi capaci di costruire una nuova catena solo in direzione 5'-3', sono stati individuati per la prima volta da Arthur Kornberg, il quale, grazie ad un suo famoso esperimento,^[86]identificò la DNA polimerasi I in Escherichia coli. La reazione della DNA polimerasi è diretta dallo stampo, perché produce un nuovo filamento di DNA esattamente complementare ad uno preesistente che funge, appunto, da stampo. La DNA polimerasi non è in grado di iniziare la sintesi di un filamento ex novo, mentre può allungare un filamento polinucleotidico preesistente. In una cellula in replicazione, dunque, è indispensabile la presenza di un filamento preesistente (detto primer), che consiste solitamente in un breve segmento di RNA complementare allo stampo, sintetizzato da enzimi specifici detti primasi.

Dal momento che le DNA polimerasi sono in grado di svolgere la loro attività solo in direzione 5'-3', esse hanno messo a punto diversi meccanismi per copiare i due filamenti della doppia elica.^[87] Un filamento (chiamato filamento veloce) può essere replicato in modo quasi continuo, man mano che viene esposto, l'altro (filamento lento) risulta invece disseminato da brevi filamenti di DNA di nuova sintesi (i frammenti di Okazaki), ognuno dei quali presenta un innesco iniziale di RNA. I nuovi filamenti devono essere quindi completati mediante la rimozione degli inneschi da parte di endonucleasi e il riempimento degli spazi rimasti ad opera di polimerasi di riparazione. Successivamente tutti questi frammenti di DNA di nuova sintesi del filamento lento vengono legati dalle DNA ligasi.

Interazioni con proteine

Tutte le funzioni del DNA dipendono dalle sue interazioni con specifiche proteine. Tali interazioni possono sia essere aspecifiche, sia prevedere un legame estremamente specifico della proteina ad una singola sequenza di DNA. Sono numerosi anche gli enzimi che possono legare il DNA e, tra questi, sono particolarmente importanti le polimerasi che copiano le sequenze nella trascrizione e nella replicazione del DNA.

Proteine che legano il DNA

Interazione del DNA con gli istoni (in bianco, nell'immagine in alto). Gli amminoacidi basici di queste proteine (in blu nell'immagine in basso a sinistra) legano in modo non covalente i gruppi fosfato del DNA, acid (in rosso in basso a destra).

Le proteine strutturali che legano il DNA sono esempi delle interazioni aspecifiche tra DNA e proteine. All'interno dei cromosomi, il DNA è associato a complessi di natura proteica, che si organizzano tra loro a formare una struttura compatta chiamata cromatina. Negli eucarioti, questa struttura presuppone il legame del DNA a piccoli complessi proteici basici chiamati istoni; nei procarioti, invece, sono coinvolti diversti tipi di differenti proteine.^[88][89] Gli istoni formano un complesso a forma di disco chiamato nucleosoma, che instaura interazioni di tipo ionico (tra i residui basici degli istoni e lo scheletro fosforico acido del DNA) con circa duecento paia di basi di DNA, che si avvolgono intorno al disco formando due giri completi, indipendentemente dalla sequenza che li caratterizza.^[90] Questi residui basici possono subire metilazioni, fosforilazioni e acetilazioni:^[91] tali modificazioni chimiche alterano l'interazione tra gli istoni e il DNA, rendendolo così più o meno accessibile ai fattori di trascrizione e modulando la velocità della trascrizione stessa.^[92]

Altre DNA-binding proteins (DNAbp) di tipo aspecifico, anch'esse presenti nella cromatina, sono le high-mobility group proteins, che legano preferenzialmente il DNA ripiegato o distorto.^[93] Queste proteine hanno un ruolo fondamentale nel ripiegamento delle file di nucleosomi e nel loro impacchettamento all'interno di strutture cromatiniche più complesse.^[94]

Un ulteriore gruppo di DNAbp sono le single-strand-binding proteins (SSBP), che si legano esclusivamente ad una molecola di DNA a singolo filamento. Nell'uomo, la RPA (replication protein A

) è il membro meglio caratterizzato di questa famiglia ed è essenziale per la maggior parte dei processi che richiedono una separazione della doppia elica, tra cui la replicazione del DNA, la sua ricombinazione e la sua riparazione.^[95] Queste DNAbp sono in grado di stabilizzare la forma a singolo filamento, impedendo che la molecola si ripieghi a formare stem loops o venga degradata dall'azione delle nucleasi.

Il repressore lambda, con la sua caratteristica struttura elica-giro-elica, legato al proprio DNA bersaglio^[96]

A differenze di quelle finora presentate, esistono anche numerose proteine che legano specificamente determinate sequenze di DNA. Quelle maggiormente studiate sono i fattori di trascrizione (TF), proteine in grado di regolare la trascrizione. Ognuna di esse si lega ad una o più sequenze specifiche, poste solitamente nei pressi del promotore di un gene, attivando o inibendo la trascrizione del gene stesso. Tale processo viene svolto attraverso due tipi di meccanismo: anzitutto, i TF sono in grado di legare, direttamente o attraverso proteine adattatrici, la RNA polimerasi responsabile della trascrizione, localizzandola presso il sito di inizio della trascrizione e favorendone dunque l'avvio;^[97] un'altra modalità consiste nel legame tra i TF ed enzimi in grado di modulare metilazioni ed acetilazioni degli istoni presenti presso il promotore, modificando dunque l'accessibilità di quella regione alla polimerasi.^[98]

Dal momento che un TF può avere numerose sequenze bersaglio, cambiamenti di attività di un TF possono avere effetti sull'espressione di migliaia di geni.^[99] Di conseguenza, queste proteine sono spesso i bersagli finali delle cascate di trasduzione del segnale, che mediano le risposte cellulari agli stimoli interni ed esterni alla cellula. La specificità dei TF per il DNA è legato ai contatti multipli che si instaurano tra la proteina ed il solco maggiore, dove le basi azotate sono maggiormente accessibili.^[100]

L'enzima di restrizione EcoRV (verde) in complesso con il suo DNA substrato^[101]

Enzimi che modificano il DNA

Nucleasi e ligasi

Le nucleasi sono enzimi in grado di tagliare filamenti di DNA, dal momento che catalizzano l'idrolisi del legame fosfodiesterico. Le nucleasi che idrolizzano il DNA partendo dai nucleotidi situati alle estremità dei filamenti sono definite esonucleasi. Sono endonucleasi, invece, quelle che tagliano direttamente all'interno del filamento. Le nucleasi più utilizzate in biologia molecolare, dette enzimi di restrizione, tagliano il DNA in corrispondenza di specifiche sequenze. L'enzima EcoRV, ad esempio, riconosce la sequenza di sei basi 5′-GAT|ATC-3′ ed effettua il taglio presso la linea verticale. In natura, questo enzima protegge i batteri dalle infezioni fagiche, digerendo il DNA del fago quando esso fa il suo ingresso nella cellula batterica.^[102] Generalmente, le nucleasi di restrizione riconoscono particolari sequenze nucleotidiche palindromiche, note come siti di restrizione, nelle quali la stessa sequenza si ripete in direzioni opposte sulle due eliche complementari, e quindi producono dei tagli su entrambi i filamenti. Tali enzimi sono utilizzati ampiamente nelle tecniche che prevedono il subclonaggio di DNA all'interno di vettori.

Le DNA ligasi sono enzimi in grado di riunire filamenti di DNA precedentemente tagliati o spezzati, utilizzando energia chimica proveniente da ATP o da NAD.^[103] Le ligasi sono particolarmente importanti nella replicazione del filamento lento, dal momento che esse riuniscono i frammenti di Okazaki in un filamento unico. Esse rivestono un ruolo importante anche nella riparazione del DNA e nella ricombinazione genetica.^[103]

Topoisomerasi ed elicasi

Le topoisomerasi sono enzimi che presentano sia un'attività nucleasica che una ligasica. Queste proteine sono in grado di modificare le proprietà topologiche del DNA. Alcune di esse svolgono tale funzione tagliando l'elica di DNA e permettendole di ruotare, riducendo il suo grado di superavvolgimento, per poi procedere alla ligazione delle due estremità.^[43] Altre topoisomerasi sono invece in grado di tagliare l'elica e far passare attraverso il sito di rottura una seconda elica, prima di ligare il filamento spezzato.^[104] Le topoisomerasi sono necessarie per molti processi che coinvolgono il DNA, come ad esempio la replicazione del DNA e la trascrizione.^[44]

Le elicasi sono proteine in grado di utilizzare l'energia chimica presente nei nucleosidi trifosfato, soprattutto ATP, per rompere i legami idrogeno che si instaurano tra le basi azotate, permettendo l'apertura della doppia elica di DNA in singoli filamenti.^[105] Questi enzimi sono essenziali per la maggior parte dei processi biologici che coivolgono enzimi che richiedono un diretto contatto con le basi del DNA.

Polimerasi

Le polimerasi sono enzimi che sintetizzano catene polinucleotidiche a partire dal nucleosidi trifosfato. Esse funzionano aggiungendo nucleotidi al 3′-OH del precedente nucleotide presente sul filamento. Come conseguenza di ciò, tutte le polimerasi lavorano in direzione 5′->3′.^[106] Nel sito attivo di questi enzimi, il nucleoside trifosfato si appaia ad un nucleotide presente su un filamento usato come stampo: ciò permette alle polimerasi di sintetizzare in modo accurato filamenti fedelmente complementari agli stampi. Le polimerasi sono classificate sulla base del tipo di stampo che utilizzano.

La replicazione del DNA richiede una DNA polimerasi DNA-dipendente, in grado cioè di realizzare una perfetta copia di una sequenza di DNA. L'accuratezza è fondamentale in questo processo, motivo per cui molte di queste polimerasi presentano anche un'attività di proofreading (dall'inglese, correzione di bozze). Esse sono infatti in grado di rilevare un errore di appaiamento (o mismatch) tra basi azotate ed attivare un'azione 3' o 5' esonucleasica per rimuovere la base scorretta.^[107] Nella maggior parte degli organismi, le DNA polimerasi funzionano all'interno di un più ampio complesso proteico definito replisoma, che consiste anche di numerose subunità accessorie come ad esempio le elicasi.^[108]

Le DNA polimerasi RNA-dipendenti sono una classe di polimerasi specializzate nella sintesi di una copia di DNA, usando come stampo un frammento di RNA. Tra di esse figurano la trascrittasi inversa, un enzima virale coinvolto nell'infezione dei retrovirus, e la telomerasi, necessaria per la replicazione dei telomeri.^[109][57] La telomerasi è una polimerasi inusuale, dal momento che contiene una sequenza stampo di RNA all'interno della propria struttura.

La trascrizione è invece svolta da RNA polimerasi DNA-dipendenti, che legano il DNA presso il promotore di un gene e separano i due filamenti. Successivamente, l'enzima genera una molecola di mRNA fino al raggiungimento del terminatore, dove si interrompe la trascrizione e l'enzima si distacca dal DNA. Come avviene per le DNA polimerasi DNA-dipendenti, anche queste polimerasi operano all'interno di un ampio complesso proteico, composto di molecole accessorie e regolatorie.^[110]

Ricombinazione genetica

La ricombinazione consiste di una rottura e successiva riunione di due cromosomi (M ed F) a produrre due cromosomi riarrangiati (C1 e C2).

Struttura di una giunzione di Holliday, intermedio di una reazione di ricombinazione genetica. I quattro singoli filamenti di DNA sono colorati di rosso, blu, verde e giallo.^[111]

Un filamento di DNA solitamente non interagisce con altri segmenti di DNA e, nelle cellule umane, i differenti cromosomi occupano addirittura regioni separate del nucleo (territori cromosomici).^[112] Tale separazione fisica è fondamentale per permettere al DNA di essere un archivio stabile e sicuro dell'informazione genetica. L'interazione tra diversi segmenti di DNA è invece possibile e frequente attraverso il fenomeno del crossing-over, che permette la ricombinazione genetica attraverso la rottura di due eliche, lo scambio di segmenti tra di esse ed il ricongiungimento finale.

La ricombinazione permette ai cromosomi di scambiare informazioni genetiche e produrre nuove combinazioni di geni, con il risultato di aumentare l'efficienza della selezione naturale e di facilitare l'evoluzione di nuove proteine.^[113] La ricombinazione genetica può anche essere coinvolta nella riparazione del DNA, in particolare come risposta cellulare in seguito a rotture a doppio filamento.^[114]

La principale forma di crossing-over cromosomico è la ricombinazione omologa, nella quale i due cromosomi coinvolti condividono sequenze molto simili. Le ricombinazioni non omologhe, invece, possono essere dannose per la cellula, perché in grado di produrre traslocazioni cromosomiche e anomalie genetiche. La reazione di ricombinazione è catalizzata da enzimi noti come ricombinasi.^[115] Il primo passaggio del processo di ricombinazione consiste nella rottura a singolo filamento provocata da una endonucleasi o da un danno al DNA.^[116] Una serie di passaggi successivi, in parte catalizzati dalla ricombinasi, porta all'unione tra due eliche attraverso la formazione di una giunzione di Holliday, nella quale un segmento a singolo filamento di ogni elica è appaiato al filamento complementare presente sull'altra elica. La reazione di ricombinazione è quindi interrotta dalla rottura della giunzione e dalla re-ligazione del DNA così ottenuto.^[117] L'esistenza della giunzione di Holliday è stata dimostrata da fotografie al microscopio elettronico di molecole di DNA in ricombinazione.

Evoluzione del metabolismo del DNA

Il DNA contiene l'informazione genetica che permette a tutti gli organismi viventi (esclusi i virus, la cui ammissibilità tra i viventi è tuttavia ampiamente dibattuta) di funzionare, crescere e riprodursi. In ogni caso, non è stato ancora chiarito in quale momento della storia della vita il DNA abbia assunto tale ruolo fondamentale. È generalmente accettato dalla comunità scientifica, infatti, l'ipotesi che il DNA non sia stato il primo acido nucleico ad essere utilizzato dai viventi: tale ruolo spetterebbe infatti all'RNA.^[106][118] L'RNA potrebbe aver giocato un ruolo centrale del metabolismo cellulare ancestrale, dal momento che può avere sia un ruolo nella conservazione dell'informazione genetica, sia uno catalitico (ad esempio attraverso i ribozimi), sia uno strutturale (all'interno dei ribosomi).^[119] Il mondo a RNA, basato su un unico tipo di molecola avente funzioni genetiche, catalitiche e strutturali, potrebbe avere avuto un'influenza sullo sviluppo dell'attuale codice genetico, basato proprio su quattro nucleotidi. Tale numero potrebbe essere un compromesso tra la necessità da una parte di ridurre la quantità di basi possibili, per migliorare l'accuratezza della replicazione, e dall'altra di aumentarla, per incrementare l'efficacia catalitica dei ribozimi.^[120]

In ogni caso, non esistono prove evidenti di questo sistema genetico ancestrale, dal momento che è impossibile recuperare DNA dai fossili. Ciò è dovuto al fatto che il DNA può sopravvivere nell'ambiente per meno di un milione di anni e, se in soluzione, si degrada rapidamente in piccoli frammenti.^[121] Sebbene ci siano stati diversi annunci di scoperte di DNA antichissimo, tra cui quella relativa all'isolamento di un batterio vivo da un cristallo di sale risalente a 250 milioni di anni fa,^[122] queste affermazioni sono ancora controverse e oggetto di discussione.^[123][124]

Utilizzi del DNA

Ingegneria genetica

La moderna biologia e biochimica fa un uso intensivo del DNA. Con il termine di DNA ricombinante ci si riferisce a segmenti di DNA realizzati e assemblati artificialmente. Essi possono essere inseriti all'interno di organismi viventi sotto forma di plasmidi o mediante altri tipi di vettori.^[125] Gli organismi così prodotti sono detti geneticamente modificati e possono essere utilizzati per la produzione di proteine ricombinanti, necessarie per la ricerca biomedica,^[126] o per le coltivazioni agricole.^[127][128]

Medicina forense

La medicina forense si serve del DNA, generalmente isolato dal sangue, dalla pelle, dalla saliva, dai capelli e da altri tessuti e fluidi biologici, per identificare i responsabili di atti criminosi, come delitti o violenze. Il processo utilizzato è il fingerprinting genetico: tale tecnica consiste nel comparare la lunghezza delle sezioni variabili del DNA ripetitivo, come le short tandem repeats ed i minisatelliti, che possono risultare molto diverse tra un individuo e l'altro. La comparazione tra due campioni di DNA in esame, non si basa perciò sull'analisi di tutta la sequenza desossiribonucleotidica, ma solo su tali sezioni. Infatti, due individui non legati da rapporti di parentela hanno in comune ben il 99,9% di sequenza di DNA. Tale metodo è solitamente molto affidabile,^[129] anche se a volte l'identificazione dei criminali può risultare complicata qualora la scena sia contaminata dal DNA di diverse persone.^[130] Questo metodo, sviluppato nel 1984 dal genetista britannico Sir Alec Jeffreys,^[131] fu usato per la prima volta nel 1988 per incriminare Colin Pitchfork. Nella pratica attuale, spesso i sospettati sono invitati a fornire un campione di DNA per il confronto con eventuali reperti biologici presenti sulla scena del delitto. Il fingerprinting genetico può essere utilizzato anche per identificare le vittime di incidenti di massa.

Bioinformatica

La bioinformatica è una branca della biologia che comprende la manipolazione, la ricerca ed il data mining dei dati relativi a sequenze di DNA. Lo sviluppo di tecniche utili ad immagazzinare e ricercare sequenze di DNA, infatti, ha condotto ad ampi sviluppi dell'informatica applicata alla biologia molecolare, specialmente per quanto riguarda gli algoritmi di ricerca di stringhe e l'apprendimento automatico.^[132] Gli algoritmi di ricerca (o appaiamento) di stringhe, in grado di individuare la presenza di una sequenza di lettere all'interno di sequenze molto più ampie, furono inizialmente sviluppati per la ricerca di specifiche sequenze nucleotidiche.^[133] Esistono da molto tempo, ovviamente, semplici algoritmi in grado di affrontare questi problemi (quelli presenti, ad esempio, negli editor di testo), ma l'analisi del DNA, che si presenta come composto di sole quattro lettere, richiede programmi più elaborati. Il problema immediatamente correlato dell'allineamento di sequenze si pone come obiettivo quello di identificare le sequenze omologhe ed individuare le specifiche mutazioni che le rendono differenti. Queste tecniche, in particolare l'allineamento di sequenze multiple, sono utilizzate per studiare le relazioni filogenetiche e la funzione delle proteine.^[134] Esistono anche algoritmi di ricerca genetica. La grande quantità di dati ottenuta da progetti come il progetto genoma umano è infatti di difficile utilizzo senza una prima analisi che permetta di localizzare i geni e le regioni regolatorie sui cromosomi. Tali algoritmi, dunque, sono in grado di riconoscere regioni putative di presenza di geni codificanti RNA o proteine.^[135]

DNA in informatica e nanotecnologie

La struttura di DNA presente a sinistra è in grado di autoassemblarsi nella configurazione presente a destra. L'uso del DNA nelle nanotecnologie sfrutta le proprietà di riconoscimento molecolare tipiche del DNA^[136]

Il DNA è stato utilizzato in informatica per la prima volta per risolvere un semplice problema di cammino hamiltoniano, un problema NP-completo.^[137] Il calcolo attraverso il DNA è più vantaggioso rispetto a quello classico per via elettronica sia dal punto di vista dell'energia consumata, sia da quello dello spazio utilizzato: strutture di questo genere sono infatti in grado di svolgere calcoli in modalità parallele che permettono di risolvere agevolmente numerosi altri problemi quali la simulazione di macchine astratte, il problema di soddisfacibilità booleana e la versione bounded del problema del commesso viaggiatore.^[138] Grazie alla sua compattezza, il DNA presenta anche un ruolo (almeno teorico) nel campo dela crittografia, nella quale permetterebbe in particolare la costituzione e l'utilizzo efficiente di cifrari di Vernam sicuri.^[139]

Il DNA è utilizzato anche nel campo delle nanotecnologie poiché presenta proprietà di riconoscimento molecolare che lo rendono in grado di auto-assemblarsi in strutture complesse di tipo bidimensionale o poliedrico. Tali assemblati sono utilizzati con funzioni essenzialmente strutturali e non come vettori di informazione biologica.

Storia e antropologia

Albero filogenetico delle miosine^[140]

Dal momento che il DNA è sottoposto nel tempo a mutazioni che vengono ereditate, esso contiene informazioni preziose che possono essere utilizzate dai genetisti per studiare l'evoluzione degli organismi e la loro filogenesi.^[141] Sulla base delle diverse mutazioni presenti in geni estremamente conservati tra gli organismi (oppure, tramite algoritmi comparativi bioinformatici più avanzati, confrontando direttamente interi genomi) i genetisti sono in grado di ricostruire alberi filogenetici in grado di descrivere l'evoluzione di diverse specie anche molto diverse tra loro.^[142][143] Studiando le mutazioni accumulatesi nel tempo, è anche possibile ricostruire alberi che descrivano l'evoluzione all'interno di famiglie di proteine.

Comparando le sequenze di DNA all'interno di una stessa specie, inoltre, è possibile studiare la storia genetica di particolari popolazioni. Ciò presenta una notevole rilevanza sia per analisi ecologiche sia per studi antropologici: il DNA è stato usato, ad esempio, per ricostruire la vicenda delle dieci tribù perdute d'Israele.^[144]

Struttura DNA

Il DNA è un polimero di unità più piccole legate tra loro attraverso legami fosfo-diesterici: i nucleotidi.
Abbiamo 4 diversi tipi di nucleotidi, che si differenziano per la base azotata che contengono. Infatti un nucleotide è costituito da uno zucchero (il deossiribosio nel DNA o il ribosio nell'RNA), un gruppo fosfato, ed una base azotata (citosina, adenina, timina, uracile, guanina).
La struttura del DNA è stata scoperta nel 1953 da Watson & Crick: il doppio filamento è costituito da due filamenti anti paralleli (e quindi con direzioni opposte, 5'-3' e 3'-5'), attorno ad un asse centrale. In funzione della composizione del filamento dell'idratazione, abbiamo diverse forme. Si distinguono infatti isoforme A, B, Z dove sono diversi alcuni parametri strutturali, come il diametro della doppia elica, o la distanza tra un filamento e l'altro..
A causa di proteine dette istoniche che si associano con il DNA, il filamento si organizza in nucleosomi, e quste si strutturano in polinucleosomi. Essi poi si condensano ulteriormente in nucleofilamenti, che si associano in anse su una struttura polisaccaridica, detta scaffold, che costituisce proprio lo scheletro del cromosoma.

Struttura del DNA


DNA Barcoding	Mutazioni Dna	di Dna,	SCRITTA FATTA CON MOLECOLA DNA

Contrassegnato da tag dna,	Secondo loro, il nostro DNA	Dna cui finora non era	I centenari hanno delle

In realtà alcuni scienziati	Structure of DNA	Un nuovo test del Dna	Esame del dna su un cane

Tutta questione di DNA?	Right Handed DNA Hall of Fame	È il nuovo DNA	DNA

dna	DNA Molecule - Two Views	Introduction to DNA Structure	DNA