OAtekno.com – Pada era Industri 4.0 ini, Big data berkembang sangat pesat. Penggunaannya pun hampir mencakup seluruh bidang industri yang berjalan. Mulai dari bidang teknologi, pemasaran, hingga kesehatan. Pasti kamu penasaran apa sih Big Data itu.
Secara harfiah, Big data dapat berarti mahadata atau data dalam jumlah yang besar. Namun, secara teknis penjelasan Big Data dan teknologinya lebih kompleks.
Yuk, simak lebih lanjut untuk mengetahui pengertian dan Teknologi Big Data!
Pengertian Big Data
Big data adalah konsep pengumpulan data dalam skala besar, yang terdiri dari tiga jenis data yaitu, data terstruktur, tidak terstruktur, dan semi terstruktur.
Data terstruktur adalah data yang format dan tata letaknya berada dalam bidang atau tempat yang tetap, misalnya data gaji karyawan yang menggunakan tabel Excel. Data jenis ini biasanya mudah dipahami dan dibaca.
Kebalikan dari data terstruktur, data tidak terstruktur memerlukan platform seperti NoSQL untuk menganalisisnya. Data jenis ini gabungan dari tipe data seperti teks, gambar, dan video. Contohnya sering ditemukan pada media sosial seperti komentar, jumlah followers, atau jumlah like di sebuah postingan.
Baca juga: SK hynix Ciptakan RAM LPDDR5X 8.5Gbps Tercepat di Dunia
Sedangkan data semi terstruktur merupakan gabungan dari data terstruktur dan tidak terstruktur Data ini memiliki karakter yang lebih kompleks dari data terstuktur tapi lebih mudah disimpan daripada data tidak terstruktur. Misalnya Email, File Zip, bahkan foto yang diambil dengan smartphone atau gadget terbaru kamu.
Selain itu, konsep Big data sendiri dimulai pada tahun 2000 oleh seorang analis industri Doug Laney. Ia membagi menjadi tiga karakteristik yaitu volume, variety, and velocity. Volume berarti sejumlah data yang besar. Variety adalah data yang berbentuk dari berbagai format. Sedang, velocity merupakan kecepatan aliran data.
Namun demikian, big data tidak dapat diproses secara tradisional. Teknologi mahadata ini diperlukan untuk mengolah dan dapat menghasilkan sebuah informasi.
Teknologi Big data
Teknologi Big data yang dikenal banyak orang saat ini adalah teknologi Hadoop. Prinsip dari teknologi ini adalah penyimpanan dan pemrosesan data terdistribusikan pada komputer-komputer yang terhubung dalam sebuah klaster. Dengan kata lain, Hadoop merupakan software yang dapat menyimpan dan mengelola data yang besar dengan menghubungkan banyak jaringan komputer untuk bekerja sama dalam satu kesatuan.
Pada Hadoop terdapat file sistem Bernama Hadoop Distributed File System (HDFS) yang berfungsi untuk penyimpanan file yang akan terdistribusi di dalam klaster Hadoop. Lalu, untuk memproses dan mengolah data HDFS akan menggunakan Mapreduce, Mapraduce sendiri merupakan model pemrograman pada teknologi ini. Adapula Hadoop YARN yang merupakan sebuah tools untuk mengelola resources dan melakukan schedulling data dalam klaster.
Terkait implementasinya, Hadoop banyak digunakan untuk pengelolaan data bagi perusahaan-perusahaan besar sekelas Facebook Yahoo! New York Times, dan Amazon. Lalu, berdasarkan data, Facebook memiliki cluster Hadoop terbesar hingga mencapai 100 petabyte sehari.