Δημοφιλείς Αναρτήσεις

Επιλογή Συντάκτη - 2019

Πιάστε την τηλεόραση σας για να σας καταλάβει καλύτερα

Anonim

Νέα έρευνα από το Πανεπιστήμιο του Waterloo έχει βρει έναν τρόπο βελτίωσης των φωνητικών ικανοτήτων κατανόησης των πλατφορμών οικιακής ψυχαγωγίας.

διαφήμιση


Η έρευνα, σε συνεργασία με το Πανεπιστήμιο του Maryland και το Comcast Applied AI Research Lab, χρησιμοποιεί τεχνολογία τεχνητής νοημοσύνης (AI) για να επιτύχει τις πιο φυσικές ομιλούμενες αλληλεπιδράσεις με τις τηλεοράσεις μέχρι σήμερα.

"Σήμερα, έχουμε συνηθίσει να μιλάμε με ευφυείς πράκτορες που κάνουν την προσφορά μας - από το Siri σε ένα κινητό τηλέφωνο στην Alexa στο σπίτι. Γιατί να μην μπορούμε να κάνουμε το ίδιο με τις τηλεοράσεις;" ρώτησε ο Jimmy Lin, καθηγητής στο Πανεπιστήμιο του Waterloo και ο πρόεδρος David R. Cheriton στη Σχολή Επιστημών Υπολογιστών του David R. Cheriton.

"Το Xfinity X1 της Comcast έχει ως στόχο να κάνει ακριβώς αυτό - η πλατφόρμα έρχεται με μια« φωνή απομακρυσμένη »που δέχεται ομιλούμενα ερωτήματα. Η επιθυμία σας είναι η εντολή της - πείτε στην τηλεόρασή σας να αλλάξετε κανάλια, να την ρωτήσετε για ταινίες για παιδιά δωρεάν, η πρόγνωση του καιρού."

Στην αντιμετώπιση του περίπλοκου προβλήματος της κατανόησης των φωνητικών ερωτημάτων, οι ερευνητές είχαν την ιδέα να επωφεληθούν από την τελευταία τεχνολογία AI - μια τεχνική γνωστή ως ιεραρχικά επαναλαμβανόμενα νευρωνικά δίκτυα - για να μοντελοποιήσουν καλύτερα το πλαίσιο και να βελτιώσουν την ακρίβεια του συστήματος.

Τον Ιανουάριο του 2018, το νέο μοντέλο νευρωνικών δικτύων των ερευνητών αναπτύχθηκε στην παραγωγή για να απαντήσει σε ερωτήματα από πραγματικούς χρήστες. Σε αντίθεση με το προηγούμενο σύστημα, το οποίο συγχέεται με περίπου το 8% των ερωτημάτων, το νέο μοντέλο χειρίζεται τα περισσότερα από τα πολύ περίπλοκα ερωτήματα κατάλληλα, βελτιώνοντας σημαντικά την εμπειρία των χρηστών.

"Αν ένας θεατής ζητήσει το" Chicago Fire ", το οποίο αναφέρεται τόσο σε σειρά δράματος όσο και σε ομάδα ποδοσφαίρου, το σύστημα είναι σε θέση να αποκρυπτογραφήσει αυτό που πραγματικά θέλετε", δήλωσε ο Lin. "Αυτό που είναι ιδιαίτερο για αυτή την προσέγγιση είναι ότι επωφελούμαστε από το πλαίσιο - όπως τα προηγουμένως παρακολουθούμενα shows και τα αγαπημένα κανάλια - για να προσαρμόζουμε τα αποτελέσματα, αυξάνοντας έτσι την ακρίβεια".

Οι ερευνητές έχουν αρχίσει να εργάζονται για την ανάπτυξη ενός ακόμα πιο πλούσιου μοντέλου. Η διαίσθηση είναι ότι με την ανάλυση ερωτημάτων από πολλαπλές προοπτικές, το σύστημα μπορεί να καταλάβει καλύτερα τι λέει ο θεατής.

Το χαρτί, η εκμάθηση πολλαπλών εργασιών με νευρωνικά δίκτυα για την κατανόηση της πλατφόρμας ψυχαγωγίας για φωνητικά ερωτήματα, παρουσιάστηκε στο 24ο Διεθνές Συνέδριο ACM SIGKDD για την ανακάλυψη γνώσης και την εξόρυξη δεδομένων που πραγματοποιήθηκε πρόσφατα στο Ηνωμένο Βασίλειο. Η έρευνα διεξήχθη από τον Jinfeng Rao, απόφοιτο διδακτορικού στο Πανεπιστήμιο του Maryland, τον σύμβουλό του Lin και τον σύμβουλο Ferhan Ture, ερευνητή στο Comcast Applied AI Research Lab.

διαφήμιση



Ιστορία Πηγή:

Τα υλικά που παρέχονται από το Πανεπιστήμιο του Waterloo . Σημείωση: Το περιεχόμενο μπορεί να επεξεργαστεί για στυλ και μήκος.