Pengenalan Kompresi Audio .MP3

Kompresi Audio

Pengenalan Kompresi Audio .MP3 – kolonginfo.com. Kebutuhan akan kapasitas penyimpanan yang besar nampaknya makin penting. Kebutuhan ini, disebabkan oleh data yang harus disimpan makin lama semakin bertambah banyak. Namun, jika suatu data dapat dimampatkan, maka akan sangat mengurangi alokasi memori yang digunakan untuk menyimpan suatu file. Kompresi data adalah proses encoding informasi dengan menggunakan lebih sedikit. Pada tulisan ini akan membahas tentang kompresi audio yaitu MPEG-1 Audio Layer 3. 

Pengertian .MP3

MPEG-1 Audio Layer 3 (.MP3) adalah salah satu format berkas pengkodean suara yang memiliki kompresi yang baik (meskipun bersifat lossy) sehingga ukuran berkas bisa memungkinkan menjadi lebih kecil. Kompresi audio kedalam format .mp3 adalah menghilangkan aspek-aspek kompresi audio yang tidak signifikan pada pendengaran manusia untuk mengurangi besarnya file audio.

Kompresi AudioKompresi Audio adalah bentuk kompresi data yang dirancang untuk mengurangi kebutuhan bandwidth transmisi digital audio stream dan ukuran penyimpanan file audio. Dengan menghilangkan aspek-aspek kompresi yang tidak signifikan maka dapat mengurangi besarnya ukuran file audio. Cara ini memiliki efektifitas yang cukup signifikan. Apabila sebuah CD Audio (dalam format CDDA) dengan kapasitas sekitar 640 MB hanya mampu menyimpan rekaman sepanjang 70 menit, maka format MP3 memungkinkan sebuah file audio dengan data rate 128 kpbs sepanjang 1 menit hanya menghabiskan spasi sebesar 1 MB pada media penyimpanan.

Ada dua kompresi data :

Lossless

Lossless data kompresi adalah kelas dari algoritma data kompresi yang memungkinkan data yang asli dapat disusun kembali dari data kompresi. Lossless tidak mempunyai masalah dalam kualitas suara. penggunaan lossless dapat difokuskan pada kecepatan kompresi & dekompresi, derajat kompresi, dan dukungan hardware dan software. Contoh format yang menggunakan lossless adalah Advanced Audio Coding atau AAC (ekstensi file: m4a, .m4b, .m4p, .m4v, .m4r, .3gp, .mp4, .aac). bahwa format tersebut mempunyai kelebihan kualitas file baik,namun tidak semua player dapat memutar file ini.

Lossy

Teknik kompresi lossy dilakukan dengan menghilangkan komponen suara yang tidak terdengar oleh manusia. Data hasil kompresi lossy tidak dapat dikembalikan lagi ke data sebelum dikompres.

Contoh file dengan kompresi lossy paling populer adalah MPEG Audio Layer 3 (.Mp3). Kelebihan dari metode ini adalah file yang dikompresi mempunyai ukuran yang kecil.

Beberapa karakteristik dari MP3  memanfaatkan kelemahan pendengaran manusia. 

1. Model psikoakustik  

  • Model psikoakustik adalah  model yang menggambarkan karakteristik pendengaran manusia.  
  • Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi 20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak perlu dikodekan.

2. Auditory masking  

Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi

3. Critical band  

Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi. 

4. Joint stereo  

Terkadang dual channel  stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo,  informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil. 

Metode Kompresi Audio

  • Metode Transformasi

Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.

  • Metode Waktu

Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps

Kualitas Audio MP3

Ketika melakukan encoding audio lossy, seperti membuat file MP3, akan ada “barter” antara ukuran file dengan kualitas suara hasil. Biasanya, saat pembuatan file mp3 dilakukan pengaturan bit rate, yang menentukan berapa banyak kbs data rate file audio tersebut. Lebih tinggi bitrate, semakin besar file yang dikompresi, dan pada umumnya kualitas suara akan terdengar semakin dekat dengan file aslinya.

Bit rate yang terlalu rendah, biasanya akan muncul artefak kompresi (misalnya, muncul suara yang tasinya tidak hadir dalam rekaman asli) mungkin terdengar dalam reproduksi file audio. Beberapa audio yang sulit untuk dikompresi karena keacakan. Saat audio jenis ini dikompresi, artefak seperti dering atau gema biasanya didengar. Contoh tepuk tangan dikompresi dengan bit rate yang relatif rendah maka akan muncul artifacts kompresi.

Selain bergantung pada bit rate, kulitas audio mp3 juga bergantung pada encoder yang digunakan dan tingkat kesulitan sinyal audio untuk disandikan(encoded). Karena tiap encoder mp3 akan memiliki algoritma yang berbeda maka tiap encoder akan menghasilkan kualitas audio mp3 yang berbeda walaupun sinyal audio dan bitrate yang digunakan adalah sama.

Referensi: Diolah dari berbagai sumber