Come identificare la colonia che contiene il gene che vogliamo clonare, tra tutte le colonie che rappresentano la libreria?

Fino a pochi anni fa, identificare e isolare un gene a partire da una libreria genomica o di cDNA non era un esperimento semplice.

Con l’aumento esponenziale del numero di informazioni disponibili sulla sequenza nucleotidica di interi genomi di molti organismi, compreso l’uomo, è diventato sempre più facile identificare un gene interessante, ricavando dapprima tutte le informazioni necessarie dalle banche di sequenze nucleotidiche, per poi passare al clonaggio vero e proprio.

Ecco come si procede, in generale, per identificare uno specifico clone all’interno di una libreria.

Conoscendo anche soltanto una piccola parte della sequenza del gene che si vuole isolare è possibile sintetizzare (per esempio tramite PCR) un frammento di DNA corrispondente, da utilizzare come sonda per una reazione di ibridazione.

La libreria genomica o di cDNA viene seminata su piastre di coltura e le colonie, una volta cresciute, vengono in parte trasferite su filtri di nitrocellulosa o nylon. Il trasferimento si ottiene semplicamente appoggiando il filtro sulla superficie della piastra.

Dopo un trattamento con una soluzione alcalina, che distrugge la parete cellulare e separa la doppia elica del DNA nei due singoli filamenti, i filtri vengono incubati con la sonda corrispondente al gene di interesse, resa radioattiva tramite l’incorporazione di un nucleotide marcato con fosforo (32P). Dopo alcuni lavaggi risultano marcate soltanto le aree del filtro corrispondenti alle colonie che contengono il gene in grado di appaiarsi alla sonda.

La visualizzazione avviene esponendo il filtro a una lastra autoradiografica dove le aree marcate appariranno sotto forma di macchie nere su sfondo chiaro. Da queste sarà possibile risalire alle colonie corrispondenti, e quindi al plasmide che contiene l’inserto che ci interessa.

Se nella banca delle sequenze non è disponibile alcuna informazione relativa al gene che si vuole clonare, è possibile ricavarla dalla proteina. In molti casi infatti l’interesse per uno specifico gene deriva dal fatto che la proteina corrispondente è stata identificata con metodi biochimici, e purificata in quantità sufficiente a determinare la sequenza di alcuni aminoacidi. Da questa informazione è possibile dedurre la sequenza nucleotidica utilizzando il codice genetico (la sequenza conterrà ambiguità dovute alla degenerazione del codice genetico).

In alternativa a questa tecnica è possibile utilizzare come sonda un anticorpo che riconosca il prodotto del gene che vogliamo clonare. In pratica si procede come descritto sopra, con la differenza che i filtri vengono incubati dapprima con l’anticorpo che lega la proteina, poi con un anticorpo secondario diretto contro il primo, che viene infine rivelato con un metodo concettualmente analogo a quello utilizzato per il Western blot.

Una volta che un gene, di cui si conosce la localizzazione cromosomica, è stato isolato dalla libreria, i cloni che contengono i geni adiacenti possono essere identificati con una tecnica nota come chromosome walking (passeggiata dei cromosomi).

Si utilizza una sonda corrispondente a un’estremità del clone isolato precedentemente. In questo modo si possono identificare i cloni che hanno una sequenza in comune (va ricordato che il taglio da parte delle nucleasi di restrizione è casuale, per cui vi sono sempre sovrapposizioni delle "code" dei frammenti di restrizione). In questo modo si incomincia una catena di corrispondenze che permette di ricostruire l’intera sequenza dei geni.

Usando metodi basati sul chromosome walking, uniti alle informazioni ottenute tramite il sequenziamento dei genomi, è stato possibile ordinare gruppi di cloni in modo da ottenere mappe fisiche dettagliate di intere regioni del genoma.

Per la definizione delle mappe fisiche sono state utilizzate librerie genomiche costruite a partire da vettori di clonaggio, come i cosmìdi o i cromosomi artificiali di lievito (YACs), in grado di contenere frammenti di DNA molto grandi, rispettivamente fino a 50.000 paia di basi e fino a 2 milioni di paia di basi.

Proteine ricombinanti