Resource allocation in visual sensor networks using a reinforcement learning framework

Pandremmenou, Katerina; Tziortziotis, Nikolaos; Kondi, Lisimachos P.; Blekas, Konstantinos

doi:10.1109/icdsp.2013.6622817

Cited by 2 publications

(1 citation statement)

References 15 publications

Supporting

Mentioning

Contrasting

Order By: Relevance

“…Last but not least, the specific RL approach gives the opportunity to the proposed scheme to be used in an online mode. Hence, the specific research effort has resulted to a conference publication presented in [141].…”

Section: Reinforcement Learning In Resource Allocationmentioning

confidence: 99%

Resource allocation and visual quality estimation for wireless video transmission

Pandremmenou¹,

Πανδρεμμένου²

View full text Add to dashboard Cite

Η παροχή της επιθυμητής ποιότητας των υπηρεσιών και της καλύτερης δυνατής ποιότηταςτης εμπειρίας του χρήστη ή ακόμη η ϐελτίωση της αποδοτικότητας των μεταδόσεων σεασύρματα δίκτυα, ϐιντεοακολουθιών που έχουν κωδικοποιηθεί με το πρότυπο H.264/AVC,παρουσιάζουν αρκετές προκλήσεις εξαιτίας των χαρακτηριστικών αυτών των δικτύων, όπωςγια παράδειγμα το περιορισμένο εύρος Ϲώνης, οι χρονικά μεταβαλλόμενες συνθήκες τουκαναλιού, οι ετερογενείς χρήστες κτλ. Σε τέτοια δίκτυα, τα δεδομένα μεταφέρονται μέσωενός ασύρματου, κοινόχρηστου μέσου, στο οποίο έχουν πρόσβαση πολλοί χρήστες. Οιχρήστες αυτοί προσπαθούν να επωφεληθούν όσο το δυνατόν περισσότερο από τους διαθέσι-μους πόρους του δικτύου και επομένως είναι απαραίτητο να κατανείμουμε δίκαια τουςπόρους ανάμεσά τους. Η κατανομή πόρων είναι ένα πρόβλημα που συναντάται σε διάφορεςυποδομές δικτύων όπως κυψελωτά δίκτυα, κανάλια με ενδιάμεσους, ϐοηθητικούς κόμβους,δίκτυα υπερευρείας Ϲώνης κ.α.Στην παρούσα διατριβή, εστιάζουμε στο πρόβλημα της κατανομής πόρων σε ασύρματαδίκτυα οπτικών αισθητήρων, τα οποία απαρτίζονται από κάμερες που ϐρίσκονται τοπο-ϑετημένες σε διάφορα σημεία και οι οποίες συμπιέζουν και μεταδίδουν τα ϐίντεο πουκαταγράφουν. Ο στόχος μας είναι να ϐελτιώσουμε την ποιότητα του ϐίντεο που ϐλέπειο χρήστης, μέσω αποδοτικής διαχείρισης των πόρων του συστήματος. Συγκεκριμένα,ϑεωρούμε ένα δίκτυο οπτικών αισθητήρων πολλαπλής πρόσβασης με διαίρεση κωδίκων καιχρήση άμεσης ακολουθίας, το οποίο χρησιμοποιεί ένα διαστρωματικό σχεδιασμό, όπου ο κάθε κόμβος του δικτύου έχει τις δικές του απαιτήσεις σε ϱυθμό bit για τη συμπίεση καισε ενέργεια (ισχύ), ανάλογα με τα χαρακτηριστικά των σκηνών που καταγράφει.Ο ϱυθμός bit σε κάθε κόμβο του δικτύου ϑα πρέπει να μοιραστεί για την κωδικοποίησητης πηγής και του καναλιού, ενώ η διαθέσιμη ισχύς ϑα χρησιμοποιηθεί για την κατα-γραφή, επεξεργασία και μετάδοση των ϐιντεοακολουθιών. Επομένως, ο ϱυθμός κωδικοποί-ησης της πηγής, ο ϱυθμός κωδικοποίησης του καναλιού και η ισχύς αποτελούν τιςπαραμέτρους οι οποίες ϑα πρέπει να εκτιμηθούν ϐέλτιστα για κάθε κόμβο του δικτύου, έτσιώστε να πετύχουμε το καλύτερο δυνατό ισοζύγιο μεταξύ της ποιότητας των λαμβανόμενων ϐιντεοακολουθιών και της απόδοσης του συστήματος. Οι ϱυθμοί κωδικοποίησης πηγήςκαι καναλιού παίρνουν διακριτές τιμές, ενώ για τις ισχύς ϑεωρούμε δύο περιπτώσεις, ότιδηλαδή μπορούνε να πάρουνε και συνεχείς και διακριτές τιμές.Προκειμένου να κατανείμουμε ϐέλτιστα και από κοινού τους πόρους του συστήματοςσε όλους τους κόμβους, ϑεωρούμε τέσσερα κριτήρια ϐελτιστοποίησης. Τα δύο από αυτάαποσκοπούν στην ελαχιστοποίηση της παραμόρφωσης του ϐίντεο, ενώ τα υπόλοιπα δύοαναζητούν έναν κανόνα που προσφέρει δίκαιες κατανομές πόρων για κάθε κόμβο. Πιο συγ-κεκριμένα, το πρώτο κριτήριο ελαχιστοποιεί τη μέση συνολική παραμόρφωση του δικτύου(MAD), αγνοώντας ϑέματα δικαιοσύνης ανάμεσα στους κόμβους. Το δεύτερο κριτήριοελαχιστοποιεί τη μέγιστη παραμόρφωση ανάμεσα σε όλους τους κόμβους του δικτύου(MMD) και μεταχειρίζεται αμερόληπτα τους κόμβους. Επιπλέον, καθώς η ταυτόχρονημεγιστοποίηση της ποιότητας των ϐίντεο όλων των κόμβων δεν είναι δυνατή, εφαρμόζουμεσυνεργατική ϑεωρία διαπραγμάτευσης, χρησιμοποιώντας τη λύση διαπραγμάτευσης τουNash (NBS) προκειμένου να επιλέξουμε μία από τις άπειρες ϐέλτιστες κατά Pareto λύσεις,με την προϋπόθεση ότι ϑα πρέπει να ικανοποιούνται τέσσερα αξιώματα δικαιοσύνης.Ακόμη, στο ίδιο πρόβλημα χρησιμοποιούμε άλλη μία λύση από τη ϑεωρία παιγνίων, τηλύση διαπραγμάτευσης των Kalai-Smorodinsky (KSBS), η οποία ϑα πρέπει επίσης ναικανοποιεί τέσσερα αξιώματα δικαιοσύνης, και η οποία στην περίπτωσή μας εφαρμόζεταισε μη-κυρτούς χώρους ωφέλειας. Για λόγους σύγκρισης, χρησιμοποιούμε ακόμη ένα κριτήριο που μεγιστοποιεί τη συνολική ωφέλεια του συστήματος (MTU) που επιτυγχάνεταιαπό όλους τους κόμβους του δικτύου.Ιδιαίτερη προσοχή δίνουμε επίσης στη μεθοδολογία που ακολουθείται για την εξεύρεσηλύσης, χρησιμοποιώντας κάθε ένα από τα προαναφερθέντα κριτήρια. Στην περίπτωση πουοι ισχύς παίρνουν συνεχείς τιμές, προτείνουμε τη χρήση του αλγορίθμου ϐελτιστοποίησηςσμήνους σωματιδίων (PSO), ο οποίος είναι ένας αλγόριθμος υπολογιστικής νοημοσύνηςεμπνευσμένος από τη ϕύση. Επίσης, εισάγουμε έναν υβριδικό αλγόριθμο, τον υβριδικόαλγόριθμο ϐελτιστοποίησης σμήνους σωματιδίων ενεργού συνόλου (HPSOAS), ο οποίοςσυνδυάζει τον αλγόριθμο PSO με τον αλγόριθμο ενεργού συνόλου (AS). Ο αλγόριθμοςHPSOAS εκμεταλλεύεται τα πλεονεκτήματα και των δύο προαναφερθέντων αλγορίθμωνκι επομένως πετυχαίνει καλύτερη απόδοση. Για λόγους σύγκρισης, αξιολογούμε τηναπόδοση των μεθόδων interior point (IP) και trust region reflective (TRR) στο ίδιο πρόβλημαϐελτιστοποίησης, χρησιμοποιώντας καθένα από τα κριτήρια ϐελτιστοποίησης, εκτός απότο KSBS, το οποίο υπολογίζεται απευθείας από τις γραφικές αναπαραστάσεις των συνόλωνωφέλειας, ακολουθώντας μία γεωμετρική προσέγγιση. Σε μια προσπάθεια να αξιολογήσουμετα αποτελέσματα που προκύπτουν χρησιμοποιώντας κάθε κριτήριο ϐελτιστοποίησης, χρησι-μοποιούμε τέσσερις διαφορετικές μετρικές δικαιοσύνης. Η πρώτη από αυτές συνυπολογίζειϑέματα δικαιοσύνης και απόδοσης, ενώ η δεύτερη μετράει την ‘ισότητα’ της κατανομής τωνπόρων (ίσες ωφέλειες για τους κόμβους). Η τρίτη μετρική υπολογίζει τη συνολική ωφέλεια του συστήματος και η τέταρτη τη συνολική κατανάλωση ενέργειας από τους κόμβους.΄Ενα άλλο κομμάτι της τρέχουσας μελέτης εστιάζει στο πρόβλημα του καθορισμού τουϐέλτιστου μήκους της ομάδας των εικόνων (GOP) σε συνδυασμό με το πρόβλημα της κατανομής των πόρων στους κόμβους του δικτύου. Στην περίπτωση αυτή, η συνάρτησηϐελτιστοποίησης υποδεικνύεται από τα κριτήρια MAD, NBS και MTU, όπου έχουμε ναεπιλύσουμε ένα διακριτό πρόβλημα που προκύπτει από τις διακριτές τιμές των ϱυθμώνκωδικοποίησης πηγής και καναλιού καθώς επίσης και τις διακριτές τιμές των ισχύων.Για την επίλυση αυτού του προβλήματος χρησιμοποιούμε τον αλγόριθμο SARSA από τηνπεριοχή της ενισχυτικής μάθησης.Καθώς κατά τις μεταδόσεις ϐίντεο σε απωλεστικά δίκτυα η υποβάθμιση της ποιότηταςείναι αναπόφευκτη, μία κοινή πρακτική είναι να εξασφαλίζουμε υψηλότερη αξιοπιστίαστα σημαντικά κομμάτια πληροφορίας εφαρμόζοντας άνιση προστασία από λάθη (UEP).Στην παρούσα διατριβή ϑεωρούμε ένα τέτοιο σενάριο, όπου με ϐάση το αθροιστικό μέσοτετραγωνικό σφάλμα (CMSE) δίνουμε προτεραιότητα στα επιμέρους κομμάτια των ϐιν-τεοακολουθιών. Προκειμένου να εκτιμήσουμε το CMSE, προτείνουμε τη χρήση της leastabsolute shrinkage and selection operator (LASSO) μεθόδου παλινδρόμησης. Πιο συγ-κεκριμένα, εξάγουμε ορισμένα χαρακτηριστικά από τις ϐιντεοακολουθίες που έχουν κωδικο-ποιηθεί με το πρότυπο H.264/AVC και τα οποία σχετίζονται με την ποιότητα του ϐίντεο.Στη συνέχεια, τα χαρακτηριστικά αυτά τροφοδοτούν το LASSO προκειμένου να εκτιμήσουμετο CMSE, όπως αυτό προκύπτει από κάθε πιθανή απώλεια ενός τμήματος της ϐιντεοακολου-ϑίας. Με ϐάση τις εκτιμώμενες τιμές για το CMSE, ομαδοποιούμε τα επιμέρους κομμάτιατου ϐίντεο σε τέσσερις ομάδες προτεραιότητας και αναλόγως, αναθέτουμε διαφορετικούςϱυθμούς κωδικοποίησης του καναλιού σε κάθε μία από αυτές. Τέλος, προσομοιώνουμε ένα σενάριο μετάδοσης ϐιντεοακολουθιών σε ένα ενθόρυβο περιβάλλον προκειμένου ναμελετήσουμε την αποτελεσματικότητα της προτεινόμενης προσέγγισης.Στο τελευταίο τμήμα της διατριβής ασχολούμαστε με το πρόβλημα της εκτίμησης τηςποιότητας του ϐίντεο όπως την αντιλαμβάνεται ο χρήστης. Συγκεκριμένα, προτείνουμεμοντέλα που έχουν μειωμένη ή και καθόλου πρόσβαση στην αρχική ϐιντεοακολουθίαπροκειμένου να εκτιμήσουμε την ποιότητα των ϐιντεοακολουθιών που ϕτάνουν στο χρήστη,μέσω τουmean opinion score (MOS).Μελετάμε μία μεγάλη ποικιλία χαρακτηριστικών πουσχετίζονται με την ποιότητα του ϐίντεο όπως την αντιλαμβάνεται ο χρήστης και τα οποίααντικατοπτρίζουν τις παραμορφώσεις λόγω της συμπίεσης και των απωλειών πακέτωνκαθώς επίσης και τις ιδιαιτερότητες του ϐίντεο. Κατόπιν, τα χαρακτηριστικά αυτά χρησι-μοποιούνται από το LASSO για να εκτιμήσουμε την ποιότητα του ϐίντεο. Το LASSO έχειτην ικανότητα να χρησιμοποιεί ένα υποσύνολο από τα αρχικά χαρακτηριστικά, και συγ-κεκριμένα εκείνα τα οποία έχουν συγκριτικά μεγαλύτερο αντίκτυπο στη διαδικασία τηςεκτίμησης της ποιότητας των ϐιντεοακολουθιών. Για λόγους σύγκρισης, εφαρμόζουμε τιςμεθόδους παλινδρόμησης των ελαχίστων τετραγώνων (OLS) και τη Ridge σε συνδυασμό μεμία τεχνική ακολουθιακής εμπρόσθιας επιλογής χαρακτηριστικών (FFS). Ακόμη, για ναμετρήσουμε την αποδοτικότητα των μοντέλων που προτείνουμε χρησιμοποιούμε κάποιεςμετρικές απόδοσης, όπως προτάθηκαν από το video quality experts group (VQEG).Συχνά, σε προβλήματα εκτίμησης της υποκειμενικής ποιότητας του ϐίντεο ερχόμαστε αντιμέτωποι με ένα μεγάλο αριθμό χαρακτηριστικών και με ένα μικρό μέγεθος παρατηρήσε-ων. Εάν εφαρμόσουμε παλινδρόμηση σε σύνθετα σύνολα δεδομένων ενδέχεται να οδηγηθούμε σε μη ακριβείς λύσεις εξαιτίας της ύπαρξης κάποιων άσχετων χαρακτηριστικών ήχαρακτηριστικών που αποτελούν ουσιαστικά ϑόρυβο για το πρόβλημά μας ή ακόμη εξ-αιτίας του προβλήματος της υπερπροσαρμογής. Γι΄ αυτό το λόγο επεκτείνουμε την έρε-υνα μας και εισάγουμε ένα εύρωστο μοντέλο χωρίς αναφορά, το οποίο παρουσιάζει καλήγενικευτική ικανότητα σε άγνωστα δεδομένα, για ϐιντεοακολουθίες που πλήττονται απόπαραμορφώσεις εξαιτίας της συμπίεσης και των απωλειών πακέτων. Το μοντέλο πουπροτείνουμε ϐελτιώνει την ακρίβεια εκτίμησης του MOS ολόκληρης της ακολουθίας, κάνο-ντας εκτιμήσεις για το MOS κάθε καρέ. Αξίζει να σημειωθεί ότι το MOS ολόκληρης τηςακολουθίας προκύπτει ως ο μέσος όρος των εκτιμήσεων των MOS όλων των καρέ, κι όχιεφαρμόζοντας παλινδρόμηση απευθείας σε επίπεδο ακολουθίας. Καθώς δεν είναι πρακ-τικό να λάβουμε το πραγματικό MOS όλων των καρέ κάνοντας πειράματα με χρήστες, αντ΄αυτού προτείνουμε μία αντικειμενική μετρική η οποία παρέχει μια αξιόπιστη ένδειξη γιατην ποιότητα κάθε καρέ του ϐίντεο δίνοντας συγχρόνως μια εικόνα για τη συνεισφορά τουστο συνολικό σκορ της ποιότητας του ϐίντεο.

show abstract

Section: Reinforcement Learning In Resource Allocationmentioning

confidence: 99%

Resource allocation and visual quality estimation for wireless video transmission

Pandremmenou¹,

Πανδρεμμένου²

View full text Add to dashboard Cite

show abstract

Cross-Layer Resource Allocation for Wireless Visual Sensor Networks and Mobile Ad Hoc Networks

Kondi¹

2014

View full text Add to dashboard Cite

Resource allocation in visual sensor networks using a reinforcement learning framework

Cited by 2 publications

References 15 publications

Resource allocation and visual quality estimation for wireless video transmission

Resource allocation and visual quality estimation for wireless video transmission

Cross-Layer Resource Allocation for Wireless Visual Sensor Networks and Mobile Ad Hoc Networks

Contact Info

Product

Resources

About