31/10/2018

Θέλω να ακούω mp3

Προσπαθώ να θυμηθώ: Napster, Audiogalaxy, eMule. Πρέπει να ήταν το σωτήριο έτος 2000 όταν ένας συνάδελφος με «μύησε» στις «υπηρεσίες» ανταλλαγής μουσικής και στο Napster. Βλέπετε τότε το Ίδρυμα Τεχνολογίας και Έρευνας διέθετε την απίστευτη ταχύτητα Internet των 2Mbps. Το Εθνικό Μετσόβιο Πολυτεχνείο δε, «διέθετε» τραγούδια mp3 σε ποιότητα 256kbps ή ακόμα και στην αστρονομική των 320kbps για «ανταλλαγή» μέσω του δικτύου. Σε αυτό το σημείο ας βγάλουμε τα εισαγωγικά, όλοι γνωρίζουμε τι δουλειά έκανε αρχικά το Napster. Τότε όμως δεν το λέγανε πειρατεία αλλά καινοτομία και, όντως, υπηρεσίες σαν το Napster άνοιξαν τον δρόμο για τις σημερινές υπηρεσίες ροής μουσικής και πώλησης ψηφιακών αρχείων αντί φυσικών μέσων.
Από τις αρχικές ηρωικές εποχές του Internet μέχρι σήμερα έχει κυλήσει πολύ νερό στο αυλάκι. Οι δισκογραφικές εταιρείες που αρχικά αντιστάθηκαν σθεναρά στην ψηφιακή μετάδοση της μουσικής και στα ψηφιακά αντίγραφα σήμερα απολαμβάνουν εκατομμύρια ακροατών μέσω των εικονικών καταστημάτων τύπου iTunes και των υπηρεσιών ροής τύπου Spotify. Τι γίνεται όμως με τις παλιές συλλογές που κατοικοεδρεύουν σε CD; Τα CD διαθέτουν την καλύτερη δυνατή ποιότητα από τα φυσικά ψηφιακά μέσα ευρείας κατανάλωσης και αξίζουν το ίδιο όταν μετατραπούν σε ψηφιακά αρχεία. Κατά την μεταφορά και μετατροπή τους σε ψηφιακά αρχεία υπάρχουν δύο δρόμοι που μπορούν να ακολουθηθούν για να μειωθεί ο όγκος των δεδομένων: αυτός της μη απωλεστικής συμπίεσης σε αρχεία .flac και αυτός της απωλεστικής συμπίεσης σε αρχεία .mp3. Χωρίς να χρειαστεί να επεκταθούμε περισσότερο στο συγκεκριμένο θέμα, η σύντομη απάντηση / λύση είναι ψηφιοποίηση των CD αυστηρά σε αρχεία τύπου .flac για να μην χαθεί τίποτα από την αρχική ποιότητα. Σαν οπαδός της ηχητικής απόλαυσης δε, δηλώνω σε όλους τους τόνους ότι μόνο η ψηφιοποίηση σε αρχεία .flac είναι ακουστικά ανεκτή μιας και η ακρόαση μουσικών αρχείων .mp3 γρατζουνάει τα αυτιά και κουράζει. Σε αυτό το σημείο όμως μπορεί να αρχίσουν τα θέματα με τα αρχεία .flac.
Ο αρχικός όγκος δεδομένων του κάθε CD κυμαίνεται περί τα 700ΜΒ και τα παραγόμενα αρχεία .flac στα μισά. Εν έτει 2019 αυτό το επίπεδο όγκου δεν αποτελεί περιοριστικό παράγοντα για τους σύγχρονους σκληρούς δίσκους. Αν κάποιος όμως διαθέτει μεγάλη συλλογή 2-3 χιλιάδων τραγουδιών μπορεί να δημιουργηθεί θέμα χωρητικότητας σε παλαιότερες φορητές συσκευές, smartphone, ταμπλέτες και καρτούλες microSD που διαθέτουν περιορισμένη συνολική χωρητικότητα. Την λύση βέβαια εδώ έρχεται να δώσει η απωλεστική συμπίεση και τα μουσικά αρχεία με φορμά .mp3 .ogg και άλλα. Ας γίνουμε πιο σαφείς: ναι, εξοβελίζουμε στο πυρ το εξώτερο τα αρχεία απωλεστικής συμπίεσης όσον αφορά την τελική ποιότητα ήχου που προσφέρουν αλλά τα δεχόμαστε όταν οι συνθήκες το υπαγορεύουν όπως η ακρόαση με φορητές συσκευές που χρησιμοποιούνται σε θορυβώδη περιβάλλοντα. Εδώ η όποια διαφορά της ηχητικής ποιότητας περνάει σε δεύτερη μοίρα όταν συγκριθεί με την δραματική αύξηση του αριθμού των τραγουδιών για την ίδια χωρητικότητα αποθηκευτικού μέσου που επιτρέπει η απωλεστική συμπίεση λόγω μικρότερου μεγέθους αρχείων.
Πόσο μικρότερο όμως μέγεθος αρχείων και πόσο ανεκτή είναι η μείωση της ποιότητας; Καταρχήν θα βάλουμε στην άκρη τα αρχεία τύπου .ogg. Αν συγκριθούν με τα αρχεία .mp3 σε ανάλογη κωδικοποίηση τότε καταλήγουν σε μεγαλύτερο όγκο δεδομένων και χειρότερη ποιότητα ήχου. Αυτό είναι λογικό γιατί υπάρχει τεράστια πείρα και βελτιστοποίηση στην κωδικοποίηση .mp3 και στα εργαλεία (βλέπε LAME). Η κωδικοποίηση .ogg συνιστάται μόνο σε πολύ χαμηλούς ρυθμούς κωδικοποίησης που έτσι κι αλλιώς δεν χρησιμοποιούνται για σοβαρή ακρόαση μουσικής.
Πολλοί αναφέρουν ότι το καλύτερο σενάριο για την κωδικοποίηση .mp3 είναι η μεταβλητή συμπίεση. Δεν έχουμε κανένα λόγο να διαφωνήσουμε μιας και αυτή η άποψη έχει βάση. Χρησιμοποιούνται περισσότερα δεδομένα όταν απαιτούνται από την πολυπλοκότητα του μουσικού περιεχομένου και λιγότερα όταν δεν απαιτούνται.

Ποιες είναι στην πράξη οι διαφορές;
Οι δοκιμές μας περιέλαβαν κωδικοποιήσεις .mp3 320, V0, V1, V2, V3, V4, V5, V6 και .ogg Q10, Q9, Q8, Q7, Q6, Q5, Q4 με τις μέγιστες δυνατές ρυθμίσεις όσον αφορά την ποιότητα σε κάθε κωδικοποίηση. Sorry no AAC. Μετά από μία πρώτη επεξεργασία των αποτελεσμάτων απορρίψαμε τις κωδικοποιήσεις που δεν έχουν νόημα ύπαρξης είτε λόγω ποιότητας είτε λόγω οικονομίας δεδομένων είτε λόγω συνδυασμού των δύο. Ας αρχίσουμε από την βασική απαίτηση, την οικονομία όγκου δεδομένων. Ο πίνακας περιλαμβάνει τέσσερεις περιπτώσεις κωδικοποίησης .mp3 και έχει βγει από το μέσο όρο 1.000 αρχείων. Θεωρούμε σαν βάση τον όγκο που καταλαμβάνει ένα αρχείο .flac με ρυθμίσεις μέγιστης (μη απωλεστικής βέβαια) συμπίεσης σαν 100%.

<![if supportMisalignedColumns]> <![endif]>
Κωδικοποίηση
/ Συμπίεση - Δειγματοληψία Αρχείου
Αναφερόμενος
Ρυθμός Κωδικοποίησης
Μέγεθος
Αρχείου %
Μείωση
FLAC / Μη Απωλεστική Level 8 (Μέγιστη Συμπίεση) 100,0  
mp3 / Απωλεστική Σταθερή 320kbps 320kbps 35,5 x 2,8
mp3 / Απωλεστική Μεταβλητή V0 240 (220 - 260)kbps 30,0 x 3,3
mp3 / Απωλεστική Μεταβλητή V2 190 (170 - 210)kbps 22,2 x 4,5
mp3 / Απωλεστική Μεταβλητή V4 160 (140 -185)kbps 18,2 x 5,5
Πρώτα, και για συγκριτικούς λόγους, βλέπουμε την οικονομία χώρου σε .mp3 με τις καλύτερες ρυθμίσεις ποιότητας και σε κωδικοποίηση σταθερής απωλεστικής συμπίεσης στα 320kbps που είναι και η μεγαλύτερη ευρέως υποστηριζόμενη κωδικοποίηση. Εδώ το μέγεθος αρχείου πέφτει στο 35% του αρχικού όγκου ή μειωμένο 2,8 φορές από το αρχικό .flac. Καθόλου άσχημα. Αν ανατρέξετε στους πίνακες του LAME η κωδικοποίηση .mp3 320kbps αναφέρεται σαν preset insane. Μην πιστεύσετε ούτε κατά το ελάχιστο τον ισχυρισμό αυτό. Ούτε το Hi-Res AUDIO flac δεν είναι insane.
Στην δεύτερη περίπτωση έχουμε το καλύτερο ποιοτικά σενάριο μεταβλητής απωλεστικής συμπίεσης V0 η οποία αναφέρεται σαν 240Kbps και κυμαίνεται κυρίως από 220 – 260kbps. Εδώ το μέγεθος αρχείου πέφτει στο 30% του αρχικού όγκου ή μειωμένο 3,3 φορές από το αρχικό .flac. Ακόμα καλύτερα. Στους πίνακες του LAME η κωδικοποίηση mp3 V0 kbps αναφέρεται σαν preset extreme. Εσείς σκεφτείτε την σαν την καλύτερη δυνατή μεταβλητή κωδικοποίηση.
Στην τρίτη περίπτωση έχουμε ένα μέτριο ποιοτικά σενάριο μεταβλητής απωλεστικής συμπίεσης V2 η οποία αναφέρεται σαν 190Kbps και κυμαίνεται κυρίως από 170 – 210kbps. Αποτελέσματα ακροάσεων αναφέρουν ότι η κωδικοποίηση V2 είναι και η ελάχιστη ανεκτή χωρίς να χάνεται μεγάλο μέρος του αρχικού μουσικού περιεχομένου. Εδώ το μέγεθος αρχείου πέφτει στο εντυπωσιακό 22,2% του αρχικού όγκου ή μειωμένο 4,5 φορές από το αρχικό .flac. Απίστευτο το ότι με τέτοια συμπίεση η μουσική ακούγεται ακόμα σαν μουσική, έστω με αρκετές ατέλειες. Στους πίνακες του LAME η κωδικοποίηση .mp3 V2 kbps αναφέρεται σαν preset standard. Εσείς σκεφτείτε την σαν την ελάχιστη θεμιτή μεταβλητή κωδικοποίηση.
Στην τέταρτη περίπτωση έχουμε ίσως το κατώτερο ανεκτό ποιοτικά σενάριο μεταβλητής απωλεστικής συμπίεσης V4 η οποία αναφέρεται σαν 160Kbps και κυμαίνεται κυρίως από 140 – 185kbps. Θεωρείστε ότι η κωδικοποίηση .mp3 V4 είναι η βάση για μουσικό περιεχόμενο και οι κωδικοποιήσεις από εκεί και κάτω προορίζονται μόνο για ομιλία. Εδώ το μέγεθος αρχείου πέφτει στο 18,2% του αρχικού όγκου ή μειωμένο 5,5 φορές από το αρχικό .flac. Σε μικρά φορητά ηχειάκια - τρανζιστοράκια η μουσική ακούγεται σαν μουσική. Στους πίνακες του LAME η κωδικοποίηση .mp3 V4 kbps αναφέρεται σαν preset medium. Εσείς σκεφτείτε την σαν «ειδικών περιστάσεων και χαμηλών προσδοκιών».

Όλα καλά με την οικονομία δεδομένων, τι γίνεται με την ηχητική ποιότητα;
Παίρνοντας σαν βάση τα αρχεία .flac που δεν διαφέρουν σε σχέση με το αρχικό CD και τις προσωπικές μας εκτιμήσεις, από εκεί και πέρα ο δρόμος είναι απότομα κατηφορικός. Αρχικά, και σαν παρένθεση, απογοητευτήκαμε από την ποιότητα των αρχείων .ogg Q10 που διαθέτουν κωδικοποίηση 500kbps, πολύ κοντά σε αυτήν του .flac. Ο ήχος ήταν καθαρά συμπιεσμένος και διαφορετικός από τον αρχικό σε σημείο που «δεν αξίζει» αυτή η κωδικοποίηση.
Τα αρχεία .mp3 320kbps, ανάλογα με το μουσικό περιεχόμενο, αποτελούν έναν πολύ καλό συμβιβασμό στην σχέση περιορισμού όγκου / ποιότητας. Στατιστικά σε εργαστηριακές ελεγχόμενες ακροάσεις, στο 60% των περιπτώσεων ακόμα και ένα εκπαιδευμένο αυτί δεν θα ακούσει σημαντικές και ενοχλητικές διαφορές σε σχέση με το αρχικό περιεχόμενο. Εκεί που δεν μπορεί όμως η οποιαδήποτε απωλεστική συμπίεση να ξεγελάσει τον ακροατή είναι στην πολύωρη ακρόαση. Η αφαίρεση μέρους του αρχικού περιεχομένου, όσο αριστοτεχνικά και αν υλοποιείται, καταλήγει σε απώλεια καθαρότητας και σαφήνειας και σε φλυαρία που κουράζει.
Τα αρχεία .mp3 V0 με μέση μεταβλητή απωλεστική συμπίεση 240kbps μειώνουν άλλο ένα 5,5% τον τελικό όγκο δεδομένων σε σχέση με τα .mp3 320kbps καταλήγοντας στο αξιόλογο 30% του αρχικού όγκου σε .flac. Σε ποιότητα ήχου η κωδικοποίηση V0 είναι πολύ - πολύ κοντά σε αυτήν που προσφέρει η κωδικοποίηση κατά .mp3 320kbps, σε σημείο που στην πλειονότητα των περιπτώσεων οι διαφορές είναι αμελητέες. Αν βάλουμε στην εξίσωση συνολικά την πρόσθετη οικονομία και την προσφερόμενη τελική ποιότητα, η κωδικοποίηση κατά .mp3 V0 προσφέρει ίσως την πιο ελκυστική πρόταση σχέσης μείωσης όγκου / ποιότητας.


Διάγραμμα 1: Η ένταση ανά συχνότητα ανά χρόνο ενός πλούσιου σε συχνοτικό περιεχόμενο τραγουδιού σε φορμά FLAC.

Διάγραμμα 2: Η ένταση ανά συχνότητα ανά χρόνο ενός πλούσιου σε συχνοτικό περιεχόμενο τραγουδιού σε φορμά mp3 V0.

Διάγραμμα 3: Η απώλεια περιεχομένου (ένταση ανά συχνότητα ανά χρόνο ενός πλούσιου σε συχνοτικό περιεχόμενο τραγουδιού) όταν το τραγούδι μετατρέπεται από φορμά FLAC σε mp3 V0.

Στα ανάλογα διαγράμματα μετρήσεων μας μπορείτε να δείτε σύνθετες απεικονίσεις από το μουσικό περιεχόμενο στην αρχική μορφή .flac, στην κωδικοποίηση .mp3 V0, αλλά, και το σημαντικότερο, τις διαφορές των δύο αρχείων. To τρίτο διάγραμμα δηλαδή δείχνει τι αφαιρείται από το αρχικό περιεχόμενο όταν αυτό κωδικοποιείται κατά .mp3 V0. Διάγραμμα 1 μείον Διάγραμμα 2 ίσον Διάγραμμα 3. Εδώ μην επικεντρωθείτε μόνο στην αφαίρεση των  υψηλών συχνοτήτων αλλά και στην σημαντική αφαίρεση χαμηλότερων κάτω από 10 kHz (κόκκινο χρώμα).
Τα αρχεία .mp3 V2 και κάτω… ηχητικό χάος. Σε ειδικές περιπτώσεις όπου ο όγκος των δεδομένων είναι μέγιστης σημασίας τα αρχεία .mp3 V2 με μέση μεταβλητή απωλεστική συμπίεση 190kbps μειώνουν τον τελικό όγκο δεδομένων στο 22,2% σε σχέση με τα .flac, νούμερο που οπωσδήποτε δεν μπορεί να αγνοηθεί, αν αυτό είναι το ζητούμενο. Συνιστούμε την χρήση της κωδικοποίησης .mp3 V2 μόνο σε περιπτώσεις όπου η μουσική αναπαράγεται από μικρά «κονσερβάκια». Το ίδιο ισχύει και για την κωδικοποίηση .mp3 V4 η οποία προσφέρει ακόμα χειρότερα ηχητικά αποτελέσματα και πρέπει να υπολογιστεί μόνο σε ακραίες περιπτώσεις όπου δεν ενδιαφέρει η ποιότητα ήχου αλλά ο τελικός όγκος δεδομένων για να χωρέσει όση περισσότερη μουσική σε μία καρτούλα.

Δια Ταύτα
Το σε τι ποσοστό μπορεί κάποιος να συμβιβαστεί με την απώλεια ηχητικής ποιότητας για να κερδίσει σε μείωση όγκου δεδομένων στα μουσικά αρχεία είναι τόσο αντικειμενικό όσο και υποκειμενικό θέμα. Το σίγουρο είναι ότι υπάρχουν πολλές περιπτώσεις όπου υπάρχει ανάγκη μείωσης όγκου οπότε η απωλεστική συμπίεση κατά .mp3 είναι μονόδρομος. Η εποχή όπου όλες οι υπηρεσίες ροής, όλα τα ιντερνετικά ραδιόφωνα και όλα τα διαδικτυακά μαγαζιά θα διαθέτουν περιεχόμενο συμπιεσμένο μη απωλεστικά απέχει λίγα χρονάκια. Όπως απέχει η εποχή όπου όλη η προσωπική σας μουσική συλλογή θα χωράει σε αρχεία .flac στην οποιαδήποτε φορητή συσκευή διαθέτετε. Μέχρι τότε το φορμά .mp3 και η απωλεστική συμπίεση θα παραμένουν στο προσκήνιο. Η δικιά μας άποψη στην χρήση των αρχείων .mp3 για την ακρόαση μουσικής είναι ότι η κωδικοποίηση .mp3 V0 προσφέρει τον βέλτιστο συνδυασμό ηχητικής ποιότητας / μείωσης όγκου δεδομένων. Διαλέξτε την σε περιπτώσεις smartphone και mp3 player με ακρόαση ακουστικών ή έξοδο σε συνοδευτικό στερεοφωνικό συγκρότημα. Σαν δεύτερη επιλογή εκεί όπου η μείωση του όγκου είναι μεγαλύτερης προτεραιότητας από την ηχητική ποιότητα μπορεί να χρησιμοποιηθεί η κωδικοποίηση .mp3 V2. Διαλέξτε την σε περιπτώσεις μικρών φορητών ηχείων ή σε οδήγηση με ανοικτό παράθυρο.