Proses Logika Penyimpanan Genetik (DNA)

Berpedoman pada pemikiran sekelompok peneliti asal The Chinese University of Hong Kong mencari cara bagaimana menyimpan data ke dalam DNA bakteri. Ternyata tidak sulit. Pada bakteri, ada empat basis DNA yang bisa digunakan untuk membuat untaian DNA yakni Adenine (A), Cytosine (C), Guanine (G), dan Thymine (T). Artinya, penyimpanan akan menggunakan sistem angka basis empat.
Angka basis 4 ini kemudian diubah ke dalam sistem DNA yang menggunakan kode A, T, C, dan G di mana A menggantikan angka 0, T menggantikan 1, C menggantikan angka 2, dan G pengganti angka 3.

Dalam Pemrosesannya, data akan mengalami tahap – tahap : 
Encode
Synthesize
Sequence
Decode


1. ENCODE
         
proses pegkodean

Data yang akan disimpan dalam DNA, akan terlebih dahulu mengalami beberapa tahap pengkodean.
Contoh :
mengubah kata “iGEM” ke dalam kode yang siap disimpan dalam DNA, Mereka menggunakan tabel ASCII untuk mengonversi setiap huruf ke dalam nilai numerik. Dalam hal ini, digunakan huffman kode.  Jadi, Misalnya i = 105, G = 71, dan seterusnya. Angka ini kemudian diubah menjadi penomoran basis 4 yakni 105 menjadi 1221, 71 menjadi 0113 dan seterusnya. Angka basis 4 ini kemudian diubah ke dalam sistem DNA yang menggunakan kode A, T, C, dan G, sehingga , kata iGEM disimpan di dalam DNA sebagai ATCTATTGATTTATGT.

Berikut gambar Pengkodean Digital dalam DNA


 Keterangan: 
(Dengan warna biru) Di sini digit biner memegang kode ASCII untuk bagian dari Shakespeare soneta 18, diubah ke basis-3. 
(warna merah) Menggunakan kode Huffman yang menggantikan setiap byte dengan lima atau enam basis-3 digit (trits). Hal ini pada gilirannya dikonversi in silico ke kode DNA kita 
(Warna hijau) Dengan penggantian setiap trit dengan salah satu dari 3 nukleotida yang berbeda dari yang sebelumnya digunakan, memastikan tidak ada homopolimer yang dihasilkan. Ini membentuk dasar untuk sejumlah besar tumpang tindih segmen panjang 100  basis dengan tumpang tindih dari 75  pangkalan, menciptakan redundansi empat kali lipat 
Dengan segmen alternatif terbalik dilengkapi untuk data keamanan tambahan, ungu). Kode DNA Indexing ditambahkan (kuning), juga dikodekan sebagai nukleotida DNA non-berulang.

2. SYNTHESIZE
Data yang sudah selesai di enskripsi, dan siap untuk disimpan dalam DNA, memasuki proses synthesize, dimana proses ini adalah penempatan data pada sel – sel bakteri.
Dalam pemrosesannya, peneliti membuat tiga struktur bagian untuk seluruh DNA yakni header, message, dan checksum.


Keterangan:
 Data disintesis DNA dengan menggunakan proses yang tersedia secara komersial dikembangkan oleh Agilent Technologies, proses ini mirip dengan jet tinta cetak kecuali empat kartrid warna diganti dengan empat kartrid nukleotida.
Tumpukan warna di piring adalah untai DNA dan nukleotida ditambahkan oleh nukleotida "ink-jet" yang melayang di atas piring, dengan proses inilah data ditempatkan pada sel – sel bakteri.


3. SEQUENCE

Data yang telah disimpan dalam bakteri, dapat diambil kembali melalui proses Sequence, dimana Sebuah decrypter akan mengambil DNA dan menjalankannya pada sebuah teknologi yang disebut next-generation high-througput sequencing (NGS). Tipe sequencing ini dapat menganalisa dan membandingkan banyak copy dari sequence yang sama dan menggunakan modus terbanyak untuk mengetahui basis data mana yang benar dan data mana yang telah mengalami perubahan. Setelah itu, algoritma kompresi akan dibalikkan untuk mengembalikan data mentah ke dalam bentuk aslinya.

Keterangan:
 Untai awal DNA beruntai ganda dipanaskan sampai memisahkan dua helai (warna biru) dan kemudian didinginkan untuk memungkinkan taq polimerase (dalam warna hijau dan pink) untuk melampirkan kedua untai, Taq polymerase membangun untai komplementer (garis berlekuk-lekuk biru) dalam 5 'ke 3' arah dan setelah itu dilakukan dengan proses berulang, DNA ini kemudian diurutkan oleh suatu proses yang juga dikembangkan oleh Agilent Technologies.

4. DECODE
Proses Decode adalah penyusunan kembali pecahan-pecahan data dalam urutan yang benar agar rangkaian DNA tersebut bisa diterjemahkan kembali menjadi data yang dapat digunakan.
Sampai tahap ini, data sudah disimpan dalam bentuk enkripsi, untuk mengembalikan data kembali utuh seperti semula, diperlukan semacam kata sandi untuk menyusunnya kembali, karena data yang disimpan dapat dienkripsi–diacak sehingga tidak dapat dibaca tanpa memasukkan semacam kata sandi.

Dengan menggunakan cara tersebut berhasil menyimpan data bakteri E.coli. Dalam uji coba, data sebesar 90 gigabita (gigabyte) disimpan dalam 1 gram bakteri yang setara dengan 100 juta sel. Data yang disimpan dapat dienkripsi–diacak sehingga tidak dapat dibaca tanpa memasukkan semacam kata sandi.

Artikel Berkaitan -BIODISK-


Teknologi Masa Depan - Memory penyimpanan DNA

Memori DNA Bakteri Eschericia Coli