Detail

Keunggulan MapR untuk Solusi Big Data yang Fleksibel dalam Penemuan Obat

Thu, Jan 03 2019 | Author: PT. Central Data Technology

MapR digunakan untuk berbagai proyek berbeda di Novartis, termasuk analisis video, proteomik, dan meta-genomik. Gabungan gabungan dan alur kerja berbasis MapR dan lapisan integrasi memungkinkan peneliti ilmu kehidupan perusahaan lebih bermakna. Dengan memanfaatkan puluhan ribu percobaan yang telah dilakukan organisasi publik, yang memberi mereka keunggulan kompetitif yang signifikan.

Bisnis

Novartis Institutes for BioMedical Research (NIBR) adalah organisasi riset farmasi global yang berfokus pada penemuan obat-obatan inovatif untuk mengobati penyakit dengan kebutuhan medis yang tidak terpenuhi. Dengan lebih dari 6.000 ilmuwan, dokter, dan profesional bisnis di seluruh dunia. Novartis memiliki budaya terbuka, kewirausahaan, dan inovatif yang mendorong kolaborasi.

Tantangan

Salah satu bidang penelitian obat mereka, Next Generation Sequencing (NGS) data, membutuhkan interaksi yang berat dengan beragam data dari organisasi eksternal seperti 1000 Genom, GTEx NIH (Ekspresi Genotipe-Jaringan) dan The Cancer Genome Atlas — memberikan perhatian khusus pada klinis, fenotipik, eksperimental dan data terkait lainnya.

Solusi MapR 

David Tester, Arsitek Aplikasi untuk Novartis Institutes for Biomedical Research, dan timnya telah menggunakan MapR sebagai bagian dari sistem mereka untuk mengintegrasikan dan menganalisis beragam data dalam mempercepat penelitian obat.

Sistem Alur Kerja Baru

Untuk menyelesaikan bagian pertama dari masalah data besar NGS ini, tim Novartis membangun sistem alur kerja yang memungkinkan mereka untuk memproses data NGS sambil responsif terhadap kemajuan dalam literatur ilmiah.

Meskipun data NGS membutuhkan volume data tinggi yang ideal untuk Hadoop, masalah umum adalah bahwa peneliti mengandalkan banyak alat yang tidak bekerja pada HDFS asli. Karena para peneliti ini sebelumnya tidak dapat menggunakan sistem seperti Hadoop, mereka harus mempertahankan logika 'pembukuan' yang rumit untuk diparalelkan untuk efisiensi optimal pada Komputasi Kinerja Tinggi (HPC) tradisional.

Sistem alur kerja ini menggunakan Distribusi MapR untuk Hadoop untuk kinerja dan ketahanannya dan untuk menyediakan akses file POSIX yang memungkinkan bioinformatika menggunakan alat yang mereka kenal. Selain itu, ia menggunakan metadata peneliti sendiri untuk memungkinkan mereka menulis alur kerja yang kompleks yang memadukan aspek terbaik dari Hadoop dan HPC tradisional.

Sebagai hasil dari upaya mereka, alat alur kerja yang fleksibel sekarang digunakan untuk berbagai proyek berbeda di Novartis, termasuk analisis video, proteomik, dan meta-genomik. Manfaat tambahan adalah bahwa integrasi infrastruktur sains data ke dalam jaringan pipa yang dibangun sebagian dari alat bioinformatika lawas dapat dicapai dalam hitungan hari, bukan bulan. 

MapR dan Spark Memberi Novartis Keunggulan Kompetitif Yang Signifikan

Yayasan yang Fleksibel

Untuk bagian kedua dari masalah — persyaratan “mengintegrasikan kumpulan data publik yang sangat beragam” - tim menggunakan Apache Spark, mesin umum yang cepat untuk pemrosesan data skala besar. Pendekatan khusus mereka untuk berurusan dengan heterogenitas adalah untuk mewakili data sebagai grafik pengetahuan yang luas (saat ini triliunan tepi) yang disimpan dalam HDFS dan dimanipulasi dengan kode Spark khusus.

Penggunaan grafik pengetahuan ini memungkinkan para bioinformatika Novartis dengan mudah memodelkan cara-cara kompleks dan perubahan yang dihubungkan oleh dataset biologis satu sama lain, sementara penggunaan Spark memungkinkan mereka untuk melakukan manipulasi grafik secara andal dan pada skala.

Di sisi analitik, peneliti dapat mengakses data secara langsung melalui API Spark atau melalui sejumlah basis data titik akhir dengan skema yang disesuaikan dengan kebutuhan analitik khusus mereka. Rantai alat mereka memungkinkan seluruh skema dengan 100 miliar baris dapat dibuat dengan cepat dari grafik pengetahuan dan kemudian diimpor ke dalam teknologi basis data favorit analis.

Sebagai hasilnya, gabungan Spark dan alur kerja berbasis MapR dan lapisan memungkinkan peneliti sains kehidupan perusahaan untuk mengambil manfaat dari puluhan ribu percobaan yang telah dilakukan organisasi publik, yang memberi mereka keunggulan kompetitif yang signifikan.

Tentang Central Data Technology

Central Data Technology merupakan salah satu Value Added Distributor terbesar di Indonesia. Central Data Technology sebagai Perusahaan teknologi informasi yang mendistribusikan berbagai brand terkemuka di dunia Teknologi Informasi antara lain Oracle, F5, Fujitsu, Hitachi Vantara, Commvault, Talend, Pentaho, Mapr, Apple, AWS, dan Sundray. Central Data Technology telah menjadi penyedia berbagai solusi untuk Security, Server Storage, Database, Backup, WLAN, dan Cloud yang terdepan.

Info lebih lanjut hubungi : marketing@centraldatatech.com

 

https://mapr.com/resources/novartis-relies-mapr-flexible-big-data-solutions-drug-discovery/