Data Import pada Aplikasi R (Package: Tidyverse)

Salah satu paket yang terkenal dan harus kamu kuasai sebagai Data Scientist pengguna aplikasi R adalah Package Tydyverse. Dalam suatu program dengan tujuan pengolaan data maka diperlukan fungsi untuk melakukan Data Import atau impor data kedalam kertas kerja pemrograman R.

Pengenalan Package Tidyverse

Package Tidyverse merupakan paket yang berfungsi untuk melakukan pengolahan data pada aplikasi R seperti import, export, visualisasi, dan pemodelan data. Paket ini sangat penting untuk dikuasai oleh seorang data science pengguna aplikasi R (R Software).

Cara instal package ini dengan perintah :

install.packages("tidyverse")

Jika teman-teman belum menguasai perintah dasar pada R dapat lihat di post Pemrograman Dasar R Sofware, admin juga sudah lampirkan file cheatsheet-nya juga.

Fungsi pada Package Tidyverse

Seorang data scientist akan diperhadapkan dengan berbagai macam kondisi data, seperti data yang hilan (missing value), berbagai jenis tipe data, pembagian data (split data), kombinasi data, dan lain-lain.

Penggunaan package Tidyverse akan sangat membantu dalam pengolahan data. Berikut admin share cheatsheet penggunaan package Tidyverse

Dalam Package Tidyverse sendiri sebanarnya memiliki banyak komponen fungsi seperti ggplot untuk memvisualisasikan data, dplyr untuk melakukan manipulasi data, dan fungsi lainnya, namun pada artikel ini hanya akan dibahas 2 komponen saja yaitu komponen readr dan tidyr, untuk komponen lain akan admin buatkan post lainnya.

RStudio Education
Komponen pada Package Tidyverse

Komponen readr

Pada komponen readr, menunjukan fungsi-fungsu yang dapat digunakan untuk membaca file format berbeda-beda (csv,excel, dll), serta fungsi save as, atau pengolahan input ouput data.

Komponen tidyr

Pada komponen tidyr, menunjukkan fungsi yang dapat digunakan untuk pengolahan data setelah data di load di kertas kerja. Beberapa fungsinya seperti handle missing value yang bertujuan untuk penanganan terhadap data yang hilang apakah ingin dihapus barisnya maka dapat menggunakan fungsi drop_na(), apakah ingin me-replace data maka menggunakan fungsi replace_na(), dst.

Baca Juga:  Mengenal Lebih Dalam Mengenai Karakteristik Data Mining 2021

Agar lebih memudahkan admin juga share cheatsheet sebagai lembar bantu untuk menguasai bahasa pemrograman R. Silahkan file pdf dapat diunduh pada link dibawah.

Jika ada pertanyaan atau komentar silahkan beri komen ya,
Semoga membantu.

Be the first to comment

Leave a Reply

Your email address will not be published.


*