Rumah Audio Kenapa hadoop adalah perlawanan sempurna untuk penjujukan genom

Kenapa hadoop adalah perlawanan sempurna untuk penjujukan genom

Isi kandungan:

Anonim

Genomik klinikal adalah subjek menarik, di mana orang bekerja pada teknologi canggih untuk memproses keputusan yang cepat dan tepat. Terdapat banyak sequencer genom yang terdapat di pasaran, dan mereka menghasilkan petabytes data urutan, dan pertumbuhan dalam urutan akan menghasilkan exabytes data dalam masa terdekat. Di sini, Hadoop adalah platform sempurna untuk memproses aliran kerja genom kompleks. Hadoop boleh menyimpan dan menyusun sejumlah besar maklumat dan juga boleh memberikan analisis bermakna. (Untuk mendapatkan idea tentang betapa banyak data ini benar-benar diperlukan, baca Memahami Bits, Bytes dan Gandaan mereka.)

Masa Kini dan Masa Depan Genomik

Hari ini, pemetaan genom telah mencapai puncak pembangunannya. Banyak orang yang berkaitan dengan industri genomik yang penuh dengan rasa ingin tahu, dan sebagai peluang baru menyampaikan diri mereka, teknologi yang lebih baik adalah keperluan jam itu. Penjujukan genom adalah tugas yang sangat berulang dan berintensifkan sumber. Pada tahun 2013 sahaja, kira-kira 15 petabytes data dihasilkan, dan hanya dengan 2, 000 penghantar urutan. Jumlah rahang ini termasuk 300 KB data genom manusia yang disusun. Pada kadar pengeluaran data ini, dapat dianggarkan bahawa pada 2018, kira-kira satu exabyte data akan dihasilkan. Ini akan disebabkan oleh pertumbuhan serangga, yang akan menghasilkan lebih banyak data setiap larian. Alasan lain ialah kemunculan mesin jujukan genom yang sangat berkuasa dan kos rendah. Sejak tahun 2008, harga mesin-mesin ini semakin menurun. Ini adalah kerana mesin generasi akan datang yang kuat yang telah dipakai ke pasaran.

Keperluan Industri Pemetaan Genom

Algoritma kompleks digunakan untuk memproses data yang dikumpulkan dari genom manusia. Kemudian, maklumat ini perlu disimpan. Ia boleh dikaji semula pada masa hadapan untuk perbandingan dengan data asal. Tugas pemprosesan dan menyimpan 100 GB data tidak terlalu sukar, terutamanya apabila anda melakukannya dengan mesin yang berkuasa yang digunakan di pusat penjujukan. Kajian menunjukkan bahawa jumlah data ini boleh diproses dalam kira-kira 1, 000 jam CPU, jadi sangat mudah. Pada kadar kemajuan teknikal ini, jelaslah bahawa industri genom akan memproses beribu-ribu gigabyte dalam beberapa saat sahaja.

Kenapa hadoop adalah perlawanan sempurna untuk penjujukan genom