Kenapa hadoop adalah perlawanan sempurna untuk penjujukan genom

2026

Isi kandungan:

Masa Kini dan Masa Depan Genomik
Keperluan Industri Pemetaan Genom

Genomik klinikal adalah subjek menarik, di mana orang bekerja pada teknologi canggih untuk memproses keputusan yang cepat dan tepat. Terdapat banyak sequencer genom yang terdapat di pasaran, dan mereka menghasilkan petabytes data urutan, dan pertumbuhan dalam urutan akan menghasilkan exabytes data dalam masa terdekat. Di sini, Hadoop adalah platform sempurna untuk memproses aliran kerja genom kompleks. Hadoop boleh menyimpan dan menyusun sejumlah besar maklumat dan juga boleh memberikan analisis bermakna. (Untuk mendapatkan idea tentang betapa banyak data ini benar-benar diperlukan, baca Memahami Bits, Bytes dan Gandaan mereka.)

Masa Kini dan Masa Depan Genomik

Hari ini, pemetaan genom telah mencapai puncak pembangunannya. Banyak orang yang berkaitan dengan industri genomik yang penuh dengan rasa ingin tahu, dan sebagai peluang baru menyampaikan diri mereka, teknologi yang lebih baik adalah keperluan jam itu. Penjujukan genom adalah tugas yang sangat berulang dan berintensifkan sumber. Pada tahun 2013 sahaja, kira-kira 15 petabytes data dihasilkan, dan hanya dengan 2, 000 penghantar urutan. Jumlah rahang ini termasuk 300 KB data genom manusia yang disusun. Pada kadar pengeluaran data ini, dapat dianggarkan bahawa pada 2018, kira-kira satu exabyte data akan dihasilkan. Ini akan disebabkan oleh pertumbuhan serangga, yang akan menghasilkan lebih banyak data setiap larian. Alasan lain ialah kemunculan mesin jujukan genom yang sangat berkuasa dan kos rendah. Sejak tahun 2008, harga mesin-mesin ini semakin menurun. Ini adalah kerana mesin generasi akan datang yang kuat yang telah dipakai ke pasaran.

Keperluan Industri Pemetaan Genom

Algoritma kompleks digunakan untuk memproses data yang dikumpulkan dari genom manusia. Kemudian, maklumat ini perlu disimpan. Ia boleh dikaji semula pada masa hadapan untuk perbandingan dengan data asal. Tugas pemprosesan dan menyimpan 100 GB data tidak terlalu sukar, terutamanya apabila anda melakukannya dengan mesin yang berkuasa yang digunakan di pusat penjujukan. Kajian menunjukkan bahawa jumlah data ini boleh diproses dalam kira-kira 1, 000 jam CPU, jadi sangat mudah. Pada kadar kemajuan teknikal ini, jelaslah bahawa industri genom akan memproses beribu-ribu gigabyte dalam beberapa saat sahaja.

Kenapa hadoop adalah perlawanan sempurna untuk penjujukan genom

Isi kandungan:

Masa Kini dan Masa Depan Genomik

Keperluan Industri Pemetaan Genom

5 Alasan kenapa hijau ia adalah emas murni untuk perniagaan

Kenapa kualiti data adalah penting untuk platform analisis bersepadu - contoh penjagaan kesihatan

Kenapa percikan adalah platform data masa depan yang besar

Pilihan Editor

Apakah intensiti cahaya termodulat secara terus overdite (limdow)? - definisi dari techopedia

Apa itu debian gnu / linux? - definisi dari techopedia

Apakah palam pengulangan semula? - definisi dari techopedia

Apakah alfa dek? - definisi dari techopedia

Pilihan Editor

Apakah jarak hamming? - definisi dari techopedia

Apakah masalahnya? - definisi dari techopedia

Apakah penyerahan (ho)? - definisi dari techopedia

Apa hubungan keras? - definisi dari techopedia

Pilihan Editor

Apa itu seni bina laman web? - definisi dari techopedia

Apakah reka bentuk yang didorong jadual? - definisi dari techopedia

Apa jitter (voip)? - definisi dari techopedia

Apa itu penghalaan internet? - definisi dari techopedia

Pilihan Editor

Apakah bunyi bising? - definisi dari techopedia

Apa yang menjadi prinsip bodoh mudah (prinsip cium)? - definisi dari techopedia

Apakah ikan paus yang gagal? - definisi dari techopedia

Apa itu bintang kleene? - definisi dari techopedia

Pilihan Editor

Apakah perisian keselamatan rangkaian? - definisi dari techopedia

Apakah perisian pengurusan risiko? - definisi dari techopedia

Apakah akses radio terrestrial sejagat (utra)? - definisi dari techopedia

Apakah ujian keselamatan? - definisi dari techopedia

Kategori popular