Sunday, June 4, 2017

GENOMICS

GENOMICS

Definisi Genomics?

Genomics adalah bidang yang mempelajari genome, untuk memahami bagaimana suatu organisme bekerja, dan apa akibat dari interaksi antar gen serta pengaruh lingkungan terhadapnya. Sedangkan genome adalah materi genetik yang menjadi cetak biru atau rancangan dari suatu mahluk hidup. Informasi ini diwariskan secara turun temurun dan tersimpan dalam DNA, atau pada beberapa jenis virus, dalam RNA.
Ukuran genome dinyatakan dalam bp atau base pair, yaitu jumlah pasangan nukleotida dalam DNA.
Manusia memiliki sekitar 3 miliar bp dalam genome-nya. Sebetulnya manusia genome manusia 99.9% mirip. Namun perbedaan yang hanya 0.1% tersebut telah menghasilkan keragaman yang sangat besar pada penampilan maupun kondisi fisik seseorang.

Apa Pentingnya Genomics?

Saat ini genomics memiliki peran yang besar dalam berbagai bidang, mulai dari kesehatan, pertanian, lingkungan, industri maupun perkembangan ilmu pengetahuan. Dengan mempelajari gen, manusia dapat menemukan solusi dari banyak permasalahan mendasar di banyak bidang kehidupan.
Misalnya, di bidang medis, genomics dapat membantu dalam meningkatkan kualitas diagnosis penyakit, mengidentifikasi predisposisi terhadap penyakit tertentu (misalnya diabetes tipe 2, penyakit huntington, dll), mendeteksi virus dan bakteri penyebab penyakit, mengembangkan obat yang disesuaikan dengan informasi genetik seseorang (disebut juga ‘personalized medicine’, misalnya penggunaan penanda genetik untuk membantu menentukan dosis War¬farin, obat anti penggumapalan darah, menentukan jenis dan dosis obat untuk kanker, dll), atau memantau pengaruh gaya hidup dan lingkungan terhadap genome dan kesehatan manusia.
Di bidang lingkungan, genomics membantu untuk menemukan sumber-sumber energi yang lebih sustainable seperti biofuels, mengendalikan polusi, melakukan dekontaminasi daerah yang terkena limbah (disebut juga bioremediation, seperti misalnya mikroba yang digunakan untuk membantu membersihkan tumpahan minyak di teluk Meksiko), memantau keragaman hayati dan identifikasi spesies baru.
Dalam bidang pertanian genomics dapat digunakan untuk mengembangkan tanaman yang lebih tahan terhadap serangan hama, penyakit, dan lingkungan, dapat juga digunakan untuk membantu mengidentifikasi hama, mengembangkan tanaman pangan yang lebih kaya kandungan gizi, ataupun mengembangkan ternak yang lebih berkualitas dan tahan terhadap serangan penyakit, dan lain sebagainya.

Teknologi di Balik Perkembangan Genomics

Peran genomics yang besar tersebut dimungkinkan dengan berkembangnya teknologi dalam bidang pemetaan gen dan pengolahan data.

Next Generation Sequencing

Dengan hadirnya teknologi yang disebut dengan Next Generation Sequencing, maka biaya untuk melakukan pemetaan genetik juga mengalami penurunan yang sangat ekstrim.

Jika sebelumnya biaya untuk melakukan sequencing atau pemetaan terhadap genome manusia adalah sebesar 100 juta US$ (dana yang digunakan pada Human Genome Project, yang di-launch di tahun 1986 dan selesai pada 2003), maka saat ini biaya pemetaan genome manusia adalah sekitar 1000 US$.
Penurunan biaya dan waktu pemrosesan menjadikan pemetaan genome menjadi sebuah proses yang terjangkau, sehingga banyak pihak dapat turut memanfaatkan dan mengembangkannya. Sebagai akibatnya, genomics pun menjadi sebuah bidang yang mengalami perkembangan yang sangat cepat pada dekade terakhir ini.

Big Data

Pemetaan dan analisis genome menghasilkan dan membutuhkan data yang sangat besar. Data hasil sequencing dapat mencapai 130 GB lebih per genome. Dengan semakin banyaknya genome yang dipetakan dan dianalisis, terjadilah ledakan di sisi data yang dihasilkan.
Tantangan selanjutnya adalah bagaimana data yang sedemikian besar dapat diproses dan dianalisis, sehingga semakin banyak penelitian maupun pemanfaatan data genomics dapat dilakukan.
Salah satu pendekatannya adalah dengan cara meningkatkan kecepatan prosesor. Teknologi seperti GPU ataupun FPGA (Field Programmable Gate Arrays) menjadi beberapa alternatif dalam hal ini. Solusi lain adalah penggunaan cloud computing, di mana data yang akan digunakan diproses di cloud, sehingga para peneliti tidak perlu membangun sendiri infrastruktur yang mereka gunakan. Namun permasalahannya adalah ketika diperlukan analisis seperti variant calling untuk mendeteksi mutasi gen, sejumlah data yang sangat besar perlu diakses dan dipindahkan ke environment analisis yang sesuai. Transfer data yang sangat besar melalui jaringan menjadi sebuah permasalahan berikutnya.
Dengan kehadiran big data, khususnya Hadoop sebagai solusi komputasi dan penyimpanan data terdistribusi, para peneliti memiliki alternatif baru yang lebih terjangkau. Hadoop menjadi alternatif bagi penyimpanan dan pemrosesan data genome dengan memberikan solusi berupa : biaya yang lebih terjangkau dengan pemanfaatan commodity hardware, peningkatan kapasitas komputasi dengan penggunaan banyak mesin secara paralel, mengurangi data movement dengan melakukan komputasi secara lokal, di mana data tersebut disimpan secara fisik.
Di samping itu, saat ini telah banyak teknologi yang dikembangkan di atas ataupun melengkapi Hadoop ekosistem, seperti misalnya Hive, Pig, Mahout, Yarn, dan lain sebagainya. Terlebih lagi setelah munculnya Spark sebagai platform pemrosesan in memory secara terdistribusi, big data menjadi sebuah alternatif solusi yang tidak dapat diabaikan lagi.
Salah satu pemanfaatan teknologi big data dalam bidang genomics ini adalah ADAM, yaitu platform analisis genomik dengan format file khusus. Dibangun menggunakan Apache Avro, Apache Spark dan Parquet. ADAM pada awalnya dikembangkan oleh Universitas Berkeley dan berlisensi Apache 2.


Referensi :

Sunday, April 16, 2017

Tugas 2 softskill Pengantar Komputasi Modern

Jurnal Distributed Computing

Nama Kelompok : Adham Bachtiar
                               Agung Sergio
                               Galih Ramdhani

ABSTRAK

Dalam ilmu komputer, komputasi terdistribusi mempelajari penggunaan terkoordinasi dari komputer yang secara fisik terpisah atau terdistribusi. Sistem terdistribusi membutuhkan perangkat lunak yang berbeda dengan sistem terpusat. Distributed computing merupakan bidang ilmu komputer yang mempelajari sistem terdistribusi.Sebuah sistem terdistribusi terdiri dari beberapa komputer otonom yang berkomunikasi melalui jaringan komputer. Komputer yang saling berinteraksi untuk mencapai tujuan bersama. Suatu program komputer yang berjalan dalam sistem terdistribusi disebut program didistribusikan, dan didistribusikan pemrograman adalah proses menulis program tersebut. Distributed computing juga mengacu pada penggunaan sistem terdistribusi untuk memecahkan masalah komputasi. Dalam distributed computing, masalah dibagi menjadi banyak tugas, masing-masing yang diselesaikan oleh satu komputer.


Kata kunci : Distribusi, distributed, internet, computing, komputasi




BAB I
PENDAHULUAN
Distributed computing merupakan bidang ilmu komputer yang mempelajari sistem terdistribusi.Sebuah sistem terdistribusi terdiri dari beberapa komputer otonom yang berkomunikasi melalui jaringan komputer. Komputer yang saling berinteraksi untuk mencapai tujuan bersama. Suatu program komputer yang berjalan dalam sistem terdistribusi disebut program didistribusikan, dan didistribusikan pemrograman adalah proses menulis program tersebut. Distributed computing juga mengacu pada penggunaan sistem terdistribusi untuk memecahkan masalah komputasi. Dalam distributed computing, masalah dibagi menjadi banyak tugas, masing-masing yang diselesaikan oleh satu komputer. [1]
Tujuan dari komputasi terdistribusi adalah menyatukan kemampuan dari sumber daya (sumber komputasi atau sumber informasi) yang terpisah secara fisik, ke dalam suatu sistem gabungan yang terkoordinasi dengan kapasitas yang jauh melebihi dari kapasitas individual komponen-komponennya.
Tujuan lain yang ingin dicapai dalam komputasi terdistribusi adalah transparansi. Kenyataan bahwa sumber daya yang dipakai oleh pengguna sistem terdistribusi berada pada lokasi fisik yang terpisah, tidak perlu diketahui oleh pengguna tersebut. Transparansi ini memungkinkan pengguna sistem terdistribusi untuk melihat sumber daya yang terpisah tersebut seolah-olah sebagai satu sistem komputer tunggal, seperti yang biasa digunakannya.
Salah satu masalah yang dihadapi dalam usaha menyatukan sumber daya yang terpisah ini antara lain adalah skalabilitas, dapat atau tidaknya sistem tersebut dikembangkan lebih jauh untuk mencakup sumber daya komputasi yang lebih banyak. [1]

BAB II
PEMBAHASAN
2.1 Arsitektur Distibuted Computing
Banyak arsitektur perangkat lunak dan keras yang bervariasi yang digunakan untuk komputasi terdistribusi. Pada tingkat yang lebih rendah, penghubungan beberapa CPU dengan menggunakan jaringan sangat dibutuhkan. Pada tingkat yang lebih tinggi menghubungkan proses yang berjalan dalam CPU tersebut dengan sistem komunikasi juga dibutuhkan.
Arsitektur umum yang memungkinkan sistem terdistribusi antara lain: [2]
§  klien-server: klien menghubungi server untuk pengambilan data, kemudian server memformatnya dan menampilkannya ke pengguna.
§  arsitektur 3-tier: Kebanyakan aplikasi web adalah 3-Tier.
§  arsitektur N-tier: N-Tier biasanya menunjuk ke aplikasi web yang menyalurkan lagi permintaan kepada pelayanan enterprise. Aplikasi jenis ini paling berjasa bagi kesuksesan server aplikasi.
§  Tightly coupled: biasanya menunjuk kepada satu set mesin yang sangat bersatu yang menjalankan proses yang sama secara paralel, membagi tugas dalam bagian-bagian, dan kemudian mengumpulkan kembali dan menyatukannya sebagai hasil akhir.
§  Peer-to-peer: sebuah arsitektur di mana tidak terdapat mesin khusus yang melayani suatu pelayanan tertentu atau mengatur sumber daya dalam jaringan. Dan semua kewajiban dibagi rata ke seluruh mesin, yang dikenal sebagai peer.
§  Service oriented di mana sistem diatur sebagai satu set pelayanan yang dapat diberikan melalui antar-muka standar.
§  Mobile code: berdasarkan prinsip arsitektur mendekatkan pemrosesan ke sumber data
§  Replicated repository: Di mana repository dibuat replikanya dan disebarkan ke dalam sistem untuk membantu pemrosesan online/offline dengan syarat keterlambatan pembaharuan data dapat diterima.

2.2 Infrastruktur Distributed Computing
Berikut ini adalah infrastruktur dari distributed computing :
§  Moab Grid Suite — Cluster workload management, reporting tools, and end user submission portal
§  Remote procedure call — This high-level communication mechanism allows processes on different machines to communicate using procedure calls even though they don't share the same address space.
§  Distributed objects — Systems like CORBA, Microsoft D/COMJava RMI, ReplicaNet 
§  SOAP
§  XML-RPC
§  GLOBE
§  Acute  — Distributed functional programming with migration based on OCaml.
§  PYRO — Python Remote Objects
§  BOINC — Berkeley Open Infrastructure for Network Computing
§  GLOBUS — Home of the Globus Toolkit

2.3  Proyek Menggunakan Distributed Computing
Komputasi terdistribusi pada dasarnya adalah sebuah infrastruktur yang menghubungkan sebuah komputer dengan komputer lain di seluruh dunia yang bertujuan untuk melakukan suatu komputasi yang rumit sehingga suatu proyek yang rumit dan memakan waktu lama oleh satu superkomputer hanya membutuhkan waktu yang lebih sedikit jika dilakukan dengan sistem komputasi terdistribusi. Sebagai gambaran superkomputer tercepat per Juni 2005 yang dipegang oleh Bluegene/L memiliki kecepatan komputasi 136.800 GFlops atau 136,8 TFlops. Sedangkan sebuah komputer Pentium 4 memiliki kecepatan rata-rata 1.3 GFlops. Menurut buku rekor Guinness, proyek seti@home sejak diluncurkan pada 17 Mei 1999 hingga Juli 2001 telah mencapai komputasi sebesar 890 ZFlops. [2]
2.3.1 GRID
          GRID adalah suatu proyek yang menggunakan sistem komputasi terdistribusi yang bertujuan untuk penelitian terhadap kanker, antraks, cacar dan proyek Human Proteome Folding Project. Per 13 September 2005, GRID telah memiliki 1.283.184 user dengan total 3.380.882 komputer dengan cpu time mencapai 434.312 tahun 27 hari 8 menit 30 menit 7 detik.

Daftar Negara dengan cpu time tertinggi
No.    Negara                            Total cpu time (tahun:hari:jam:menit:detik)
1        Anonymous                   151,308:136:09:28:33
2        Amerika Serikat            124,834:135:15:34:40
3        Britania Raya                 35,955:281:11:09:43
4        Jepang                            32,775:327:21:51:18
5        Kanada                           12,333:241:20:12:52
6        Jerman                           8,791:172:04:10:58
7        Belanda                         6,367:225:21:41:59
8        Republik Tiongkok       5,132:325:02:46:00
9        Australia                       4,064:029:21:59:46
10      Polandia                        3,902:223:23:12:50
...               
56      Indonesia                       113:359:05:52:47


2.3.2 BOINC
BOINC atau Berkeley Open Infrastructure for Network Computing (BOINC) adalah sebuah infrastruktur komputasi terdistribusi yang dikembangkan oleh tim dari University of California, Berkeley Amerika Serikat. Perangkat lunaknya sendiri gratis dan open source yang dirilis di bawah GNU Lesser Public License. BOINC sendiri terdiri atas beberapa proyek.
2.3.3 SETI@home
SETI@home adalah proyek yang menggunakan sistem komputasi terdistribusi untuk melakukan perhitungan terhadap sinyal-sinyal dari angkasa luar yang sebagian besar berasal dari teleskop radio Arecibo untuk mencari kandidat terbaik bagi sinyal yang berasal dari extraterrestrial intelligence atau kecerdasan dari luar angkasa.
2.3.4 Climateprediction@net
Climateprediction@net adalah proyek yang menggunakan sistem komputasi terdistribusi untuk melakukan perhitungan rumit terhadap perubahan iklim.
2.3.5 Einstein@home
Einstein@home adalah proyek yang menggunakan sistem komputasi terdistribusi untuk melakukan pencarian terhadap bintang neutron berputar atau disebut juga pulsar dengan menggunakan data dari LIGO dan detektor gelombang gravitasi GEO.


2.3.6 LHC@home
LHC@home adalah proyek yang menggunakan sistem komputasi terdistribusi untuk melakukan simulasi perjalanan partikel di dalam sebuah Large Hadron Collider (LHC) yaitu sebuah mesin yang mempercepat partikel di dalam ruangan berbentuk donat. LHC@home sendiri menghasilkan komputasi sebesar LHC 15 Petabytes atau 15 juta Gigabytes per tahun.
2.3.7 Predictor @home
Predictor@home adalah proyek yang menggunakan sistem komputasi terdistribusi untuk melakukan perhitungan terhadap kemungkinan hubungan antara protein dengan suatu penyakit.
Daftar Negara dengan nilai tertinggi untuk total seluruh proyek BOINC
(per 13 September 2005)
No.    Negara                  Total cpu time (tahun:hari:jam:menit:detik)
1        Amerika Serikat  1,610,092,672
2        Jerman                 427,299,744
3        Britania Raya       371,713,792
4        Kanada                 191,907,664
5        Australia              111,986,128
6        Perancis               107,182,224
7        Belanda                95,328,368
8        Jepang                  85,162,256
9        Italia                    72,938,888
2.3.8 GIMPS
Great Internet Mersenne Prime Search (GIMPS) adalah sebuah proyek yang menggunakan sistem komputasi terdistribusi untuk melakukan perhitungan untuk mencari bilangan-bilangan yang merupakan bilangan prima Mersenne yaitu sebuah angka dengan rumus :
Mn = 2n − 1.
Delapan bilangan prima Mersenne terbesar ditemukan dengan menggunakan GIMPS. Bilangan prima Mersenne terbesar saat ini memiliki 9.808.358 digit angka. Lihat pula artikel mengenai bilangan prima terbesar yang diketahui.
PENUTUP
REFERENSI
ONLINE :

          

Tuesday, March 21, 2017

TUGAS 1 SOFTSKILL
MATA KULIAH PENGANTAR KOMPUTASI MODERN

OLEH GALIH RAMDHANI
NPM     : 53413628
KELAS : 4IA12
PERUSAHAAN YANG DIPILIH : Google Drive / GDrive


Komputasi modern adalah sebuah konsep sistem yang menerima intruksi-intruksi dan menyimpannya dalam sebuah memory, memory disini bisa juga dari memory komputer. Oleh karena pada saat ini kita melakukan komputasi menggunakan komputer maka bisa dibilang komputer merupakan sebuah komputasi modern.


Karakteristik komputasi modern ada 3 macam, yaitu :

1. Komputer-komputer penyedia sumber daya bersifat heterogenous karena terdiri dari berbagai jenis perangkat keras, sistem operasi, serta aplikasi yang terpasang.


2. Komputer-komputer terhubung ke jarinagn yang luas dengan kapasitas bandwidth yang beragam.


3. Komputer maupun jaringan tidak terdedikasi, bisa hidup atau mati sewaktu-waktu tanpa jadwal yang     jelas.

selain karakteristik, komputasi modern juga terdapat beberapa jenis

Jenis komputasi modern diantaranya adalah:


1. Mobile computing


   Mobile computing atau komputasi bergerak memiliki beberapa penjelasan, salah satunya komputasi bergerak merupakan kemajuan teknologi komputer sehingga dapat berkomunikasi menggunakan jaringan tanpa menggunakan kabel dan mudah dibawa atau berpindah tempat, tetapi berbeda dengan komputasi nirkabel.Dan berdasarkan penjelasan tersebut, untuk kemajuan teknologi ke arah yang lebih dinamis membutuhkan perubahan dari sisi manusia maupun alat. Dan dapat dilihat contoh dari perangkat komputasi bergerak seperti GPS, juga tipe dari komputasi bergerak seperti smart phone, dan lain sebagainya.

2. Grid computing
   Komputasi grid menggunakan komputer yang terpisah oleh geografis, didistibusikan dan terhubung oleh jaringan untuk menyelasaikan masalah komputasi skala besar.

3. Cloud computing Komputasi cloud merupakan gaya komputasi yang terukur dinamis dan sumber daya virtual yang sering menyediakan layanan melalui internet.
berdasarkan dari jenis-jenis komputasi modern, saya akan mencoba menjabarkan sedikit tentang jenis komputasi modern nomer 3, yaitu cloud computing, beserta dengan perusahaan yang menggunakan metode tersebut.

Contoh Perusahaan yang Menggunakan Cloud Computing .

1. GOOGLE DRIVE.


 


Google Drive
Google Drive adalah layanan penyimpanan Online yang dimiliki Google. Google Drive diluncurkan pada tanggal 24 April 2012. Sebenarnya Google Drive merupakan pengembangan dari Google Docs. Google Drive memberikan kapasitas penyimpanan sebesar 5GB kepada setiap penggunanya. Kapasitas tersebut dapat ditambahkan dengan melakukan pembayaran atau pembelian Storage. Penyimpanan file di Google Drive dapat memudahkan pemilik file dapat mengakses file tersebut kapanpun dan dimanapun dengan menggunakan komputer desktoplaptopkomputer tablet ataupun smartphone. File tersebut juga dapat dengan mudah dibagikan dengan orang lain untuk berbagi pakai ataupun melakukan kolaborasi dalam pengeditan.
Fitur-fitur Google Drive
·         Penyimpanan gratis sebesar 5GB
Google Drive memberikan fasilitas penyimpanan sebesar 5GB kepada penggunanya dengan cuma-cuma untuk menyimpan dokumen, baik berupa gambar, video, musik, ataupun file-file lain.
·         Memungkinkan membuat dokumen
Pada fitur ini Google Drive memungkinkan para penggunanya untuk membuat dokumen, seperti mengolah data, mengolah angka, membuat presentasi, form dan dokumen lainnya.
·         Berbagi file
Google Drive memudahkan untuk berbagi file dengan orang lain, dan juga memudahkan orang lain untuk melakukan pengeditan terhadap file yang kita buat.
·         Terintegrasi dengan layanan Google lainnya
Para pengguna layanan Google lainnya akan merasakan kemudahan dalam memanagement file dari Google Drive. Karena Google Drive secara otomatis terintegrasi dengan layanan google lainnya.
·         Fasilitas pencarian
Google Drive memberikan layanan pencarian yang lebih baik dan lebih cepat untuk para penggunanya dengan menggunakan kata kunci tertentu. Google Drive juga dapat mengenali gambar atau teks dari dokumen hasil scan.
·         Menampilkan berbagai file
Lebih dari 30 type file yang dapat dibuka dan ditampilkan oleh Google Drive, termasuk file video, file image, dan lain-lain tanpa mengharuskan pengguna untuk mengunduh dan menginstal software yang sesuai dengan tipe atau ekstensi file tersebut.
·         Menjalankan aplikasi

Google Drive juga mempunyai kemampuan untuk membuat, menjalankan dan membagi file aplikasi favorit yang dimiliki oleh pengguna.