Apa itu Redundansi Data?

Redundansi data adalah situasi yang terjadi dalam sistem basis data dan melibatkan pembuatan duplikat data yang tidak disengaja yang tidak diperlukan untuk fungsi basis data. Sementara redundansi sering merupakan sifat yang diinginkan dalam beberapa situasi, ini tidak benar ketika menyangkut fungsi database. Kehadiran data yang digandakan sering kali dapat berdampak buruk pada fungsi sistem, yang mengakibatkan pengembalian informasi sebagai respons terhadap kueri sistem yang kurang bermanfaat. Salah satu fungsi utama dari manajemen data adalah mengidentifikasi data yang terduplikasi dan menghilangkan duplikasi tersebut.

Beberapa sistem akan menandai input data yang digandakan, sehingga memudahkan untuk meninjau duplikasi yang dirasakan dan memutuskan apakah akan menghapusnya atau mengizinkannya.

Potensi redundansi data ditemukan di hampir semua jenis program database. Program yang dianggap datar, seperti spreadsheet, dan mengandalkan entri data secara manual sangat rentan terhadap duplikasi informasi yang dapat menyebabkan komplikasi saat mengambil informasi yang diinginkan. Basis data gaya relasional, seperti basis data kontak penjualan, sering kali menyertakan proses yang membantu meminimalkan kemungkinan duplikasi yang tidak disengaja, seperti pembuatan dua file kontak berbeda pada kontak yang sama yang terkait dengan perusahaan yang sama. Bahkan dengan penggunaan pemeriksaan sistem untuk membantu mengurangi kejadian redundansi data, masih ada potensi masalah yang terjadi, sehingga perlu untuk secara berkala terlibat dalam tugas pembersihan data dalam database.

Paling-paling, redundansi data berarti bahwa database dipenuhi dengan informasi yang tidak penting tetapi tidak menimbulkan ancaman nyata terhadap kemampuan untuk menemukan data kapan dan sesuai kebutuhan. Paling buruk, kehadiran data yang digandakan memperlambat fungsi penting database dan dapat memperumit proses penggunaan database untuk mengelola tugas-tugas tertentu. Misalnya, menggunakan database pelanggan yang tersumbat dengan informasi yang berlebihan untuk menghasilkan label surat akan mengakibatkan pembuatan sejumlah tingkat duplikat, sehingga perlu untuk menyortir dan membuang duplikat sebelum label dapat digunakan, atau mengambil waktu untuk membersihkan database sebelum mencoba membuat label.

Untungnya, memantau dan mengoreksi redundansi data adalah sesuatu yang dapat dilakukan oleh banyak sistem manajemen data dengan relatif mudah. Beberapa sistem akan menandai input data yang digandakan, sehingga memudahkan untuk meninjau duplikasi yang dirasakan dan memutuskan apakah akan menghapusnya atau membiarkannya tetap ada. Bahkan ada program perangkat lunak yang dapat digunakan untuk memindai database yang ada untuk duplikasi, dan secara otomatis menghapus entri yang berlebihan dengan relatif mudah.

Baca juga