Έχετε πάρει θέσεις και παρακολουθείτε μετά μεγάλης προσοχής μια αγαπημένη σας σειρά ή ταινία που έχετε επιλέξει.
Σε μια σκηνή σημαντική της πλοκής δύο από του πρωταγωνιστές μιλούν μεταξύ τους, δίδοντας κρίσιμες πληροφορίες για την εξέλιξη, ίσως προϊδεάζοντας για το τι πρόκειται να συμβεί στη συνέχεια. Μόνο που ο ένας από αυτούς μουρμουρίζει.
Στη συνέχεια, πριν το καταλάβετε, ένα γρήγορο κόψιμο στην επόμενη σκηνή και μένετε με την απορία: Τι είπε μόλις τώρα;
Η ευκρίνεια ανέκαθεν ήταν θέμα όχι μόνον για τους φανατικούς των σειρών ή των ταινιών αλλά των τηλεθεατών/θεατών γενικότερα.
Πόσω μάλλον εκείνων που αντιμετωπίζουν προβλήματα ακοής. Ενδεικτικά, στις ΗΠΑ μόνον- με βαριά οπτικοακουστική βιομηχανία και με τη σημαντικότερη καταναλωτική αγορά του κλάδου- υπάρχουν κάπου 72 εκατομμύρια άνθρωποι με απώλεια ακοής σε κάποιο επίπεδο.
Το πρόβλημα «τι είπε μόλις τώρα» έχει οξυνθεί να την ανάπτυξη των ιντερνετικών συνδρομητικών υπηρεσιών παροχής οπτικοακουστικού περιεχομένου διαρκούς ροής (εν συντομία stremers ή OTT) συνδυαστικά με την πρόσβαση σε ακόμα μεγαλύτερο εύρος ποικιλίας περιεχομένου, δηλαδή παραγωγές σε γλώσσες που ο θεατής δεν είναι εξοικειωμένος, ενδεχομένως να μην είναι εξοικειωμένος σε γλωσσικά ιδιώματα ακόμα και σε γλώσσες που μπορεί να γνωρίζει, σε δύσκολες προφορές αλλά και σε κακή ποιότητα ήχου σε πλατφόρμες κοινωνικής δικτύωσης με οπτικοακουστικό περιεχόμενο, όπως για παράδειγμα στο Youtube.
Στον κανόνα περιλαμβάνεται και το Netflix το οποίο ανέπτυξε το δικό του σύστημα μέτρησης κατανόησης της ομιλίας για να υπολογίσει πόσο δύσκολο είναι να καταλάβουν οι θεατές τους διαλόγους σε ταινίες ή σε σειρές.
Εν συντομία, το σύστημα διαχωρίζει την ομιλία από τους ήχους του περιβάλλοντος και τη μουσική για να ποσοτικοποιήσει πόσο ενοχλητικός είναι ο μη ομιλητικός ήχος σε κάθε στιγμή πλοκής.
Φυσικά, η απλή μέτρηση του προβλήματος δεν το επιλύει πραγματικά. Γι’ αυτό το λόγο, ο streamer συνεργάστηκε με το Ινστιτούτο Fraunhofer καθώς και με τη Nugen Audio για την κατασκευή λύσεων λογισμικού που βοηθούν τους τεχνικούς ήχου να μετρήσουν την καταληπτότητα των διαλόγων στο κρίσιμο στάδιο παραγωγής του post production, το μιξαζ.
Εκτός από την ενσωμάτωση του βασισμένου στη μηχανική μάθηση Dialogue Intelligibility Meter του Fruanhofer σε δημοφιλές λογισμικό σταθμού επεξεργασίας ήχου, οι τρεις εταιρείες συνεργάστηκαν επίσης σε ένα νέο εργαλείο με την ονομασία DialogCheck.
«Για έναν μηχανικό ήχου που μπορεί να εργάζεται πάνω σε μια σκηνή για ώρες ή και ημέρες, ακούγοντας τον ίδιο διάλογο εκατοντάδες φορές, είναι πρόκληση να προβλέψει πώς θα ακούγεται μια μίξη σε κάποιον που την ακούει για πρώτη φορά», εξηγεί η Nugen Audio στην ιστοσελίδα της.
Το DialogCheck υποτίθεται ότι βοηθά τους μηχανικούς παρέχοντας μια δεύτερη γνώμη με τη βοήθεια δεδομένων, σύμφωνα με την εταιρεία.
Προφανώς η ανάπτυξη και η εξέλιξη της τεχνολογίας σε αυτό τον τομέα, παρέχοντας στους τεχνικούς ήχου τα εργαλεία για καλύτερες μίξεις στο μέλλον είναι κάτι σπουδαίο.
Αλλά τι γίνεται με αυτές τις χιλιάδες ταινίες και τηλεοπτικές εκπομπές που είναι ήδη διαθέσιμες στο streaming, ή τα κλιπ του YouTube που δεν θα επωφεληθούν ποτέ από την επαγγελματική μίξη ήχου;
Η εταιρεία εξελιγμένων ηχοσυστημάτων hifi, Sonos, άρχισε να εργάζεται πάνω στη δική της λύση αντιμετώπισης της… μουρμούρας πριν από τρία χρόνια και πρόσφατα ενημέρωσε τη νέα έκδοση του ραβδοηχείου της, Arc Ultra, με μια λύση βελτίωσης ομιλίας που βασίζεται στη μηχανική μάθηση.
Η εταιρεία στην έρευνα της εντόπισε 16 διαφορετικούς παράγοντες που θα μπορούσαν να επηρεάσουν την καταληπτότητα των διαλόγων.
««Θα μπορούσαν να είναι πράγματα που συμβαίνουν μέσα στην ίδια τη μίξη Θα μπορούσε να είναι το περιβάλλον στο οποίο βρίσκεστε.
Θα μπορούσε να είναι κάποιου είδους βλάβη ή η ίδια η απώλεια ακοής. Επιπλέον, σε πολλές περιπτώσεις, δεν υπάρχει μόνο ένας ένοχος, αλλά οποιοσδήποτε συνδυασμός αυτών των 16 παραγόντων», ενημερώνει ο επικεφαλής της Sonos Sound Experience, Πολ Πις.
Ως επόμενο βήμα, στο πλαίσιο της συμπερίληψης, η εταιρεία ολοκληρωμένων ηχοσυστημάτων, συνεργάστηκε με το βρετανικό Βασιλικό Εθνικό Ινστιτούτο Κωφών για τη διεξαγωγή μελετών ακρόασης.
«Ήταν, όπως αποδείχθηκε, μια ανεκτίμησης αξίας ενέργεια για την κατανόηση του τι
πρέπει να κάνουμε», αναφέρει ο Πις.
«Ένα από τα σημαντικότερα θέματα ήταν το γεγονός ότι δεν υπάρχει μια λύση που να ταιριάζει σε όλους. Κάθε ακροατής έχει διαφορετική κατάσταση και μπορεί να απαιτούνται πολλαπλές επιλογές διόρθωσης», συμπλήρωσε.
Με αυτό το δεδομένο, η Sonos ανέπτυξε τέσσερα διαφορετικά επίπεδα για τη νέα λειτουργία βελτίωσης ομιλίας, συμπεριλαμβανομένου ενός επιπέδου Max, ειδικά σχεδιασμένου για άτομα με σημαντική απώλεια ακοής.
Η εταιρεία επίσης δημιούργησε ένα μοντέλο μηχανικής εκμάθησης ικανό να αναγνωρίζει την ομιλία στο κεντρικό κανάλι μιας μίξης ήχου – κάτι που μπορεί να είναι εκπληκτικά δύσκολο- και το «εκπαίδευσε» με πάνω από 1.000 ώρες υλικού, από τηλεοπτικές εκπομπές μέχρι ταινίες του Κρίστοφερ Νόλαν και περιεχόμενο YouTube.
Μια νέα εποχή φαίνεται να ανατέλλει στο οπτικοακουστικό περιεχόμενο, με εξελιγμένη ακουστική, βελτιώνοντας την εμπειρία του τηλεθεατή/θεατή.
Διαβάστε επίσης
Εθνική Οδός Πύργου – Κυπαρισσίας: Ένας τραυματίας από ανατροπή νταλίκας (Video)
Γλυφάδα: Τουρίστας παραβίασε STOP και προκάλεσε τροχαίο με δύο τραυματίες