Dari kursus: Dasar-dasar Rekayasa Data

Buka akses kursus ini dengan uji coba gratis

Bergabunglah sekarang untuk mengakses lebih dari 24.900 kursus yang dipandu pakar industri.

MapReduce dan Hadoop

MapReduce dan Hadoop

- [Instruktur] Saatnya berbicara tentang kerangka kerja komputasi paralel tertentu. Kami akan fokus pada kerangka kerja yang saat ini sedang populer di dunia rekayasa data. Ketika datang ke sistem data besar, Hadoop adalah kerangka kerja yang paling populer dan digunakan. Dan MapReduce adalah salah satu teknik pemrosesan paling populer. Jadi, apa itu Hadoop? Ini adalah ekosistem alat sumber terbuka yang telah mengubah cara perusahaan menyimpan, memproses, dan menganalisis data. Ini adalah kumpulan proyek sumber terbuka yang dikelola oleh Apache Software Foundation. Beberapa dari mereka agak ketinggalan jaman, tetapi masih relevan untuk membicarakannya. Ini menggunakan algoritma MapReduce. Hadoop memainkan peran sentral dalam mengembangkan alur ETL, di mana ETL adalah singkatan dari Extract, Transform, dan Load. Ada dua proyek Hadoop yang ingin kami fokuskan dalam video khusus ini; MapReduce dan HDFS. Jadi pertama-tama mari kita bicara tentang HDFS. Ini adalah sistem file…

Konten