This work proposes a bio-inspired based methodology in order to extract and evaluate user's web texts / posts. To validate the methodology, a dataset is constructed using real data arising from Greek fora. The obtained results are compared with a commonly used machine learning technique (decision trees-C4.5 algorithm). The bio-inspired algorithm (namely the hybrid PSO/ACO2 algorithm) achieved average classification accuracy 90.59% in a 10 fold cross validation experiment, outperforming the C4.5 algorithm (83.66%). The proposed methodology could be easily integrated with a decision support system providing services in the fields of ecommerce or e-government in order to help merchants acquire customer satisfaction or public administrators capture common understanding.
Abstract. Web 2.0 has facilitated interactive information sharing on the WWW, allowing users the opportunity to articulate their opinions on different topics. In this framework, certain practices implement information monitoring systems so as digests, reports on keywords and thematic queries regarding opinions on government decisions to be created. Analysis of rubrics associations, primary semantic and statistical interpretation of the texts is usually carried out. It is, on the other hand, rather difficult to get punctual predicts and estimate sufficiently forum users' opinion strength. In this work we present a methodology which automatically mines and estimates the strength of users' opinions on text forums regarding government decisions. According to our methodology, quantitative features are automatically mined from forum posts and then passed to a Support Vector Machine based classifier where the users' opinion strength is estimated. The proposed methodology has been validated in real data and initial experimental results are presented.
Οι κυβερνήσεις οδεύουν προς νέα μοντέλα Διακυβέρνησης, «eGovernment 2.0» ή Διακυβέρνηση 2.0, OpenGov ή Ανοιχτή Διακυβέρνηση, όπου ο Πολίτης εμπλέκεται ενεργά, ελέγχοντας και βελτιώνοντας το έργο τους. Οι δυνατότητες του Web 2.0 χρησιμοποιούνται ολοένα και περισσότερο για το σκοπό αυτό. Συνεπώς προσφέρονται χρήσιμες πληροφορίες ανάδρασης. Ο όγκος της συλλογικής αυτής πληροφορίας αυξάνεται με εκθετικούς ρυθμούς. Προκειμένου να είναι δυνατή η εκτίμηση των πληροφοριών ανάδρασης είναι απαραίτητη η χρήση τεχνικών εξόρυξης δεδομένων. Η παρούσα έρευνα προσπαθεί να συμβάλει στην αντιμετώπιση του παραπάνω θέματος. Προτείνεται ο σχεδιασμός, η υλοποίηση, η αξιολόγηση μιας μεθοδολογίας, εφαρμογών λογισμικού και υπηρεσιών που υποστηρίζουν την αποδοτική εξόρυξη, ανάλυση και εκτίμηση της άποψης των πολιτών. Βασικά στοιχεία καινοτομίας της παρούσης διατριβής αποτελούν: i) Ο σχεδιασμός η υλοποίηση και ο έλεγχος (με πραγματικά δεδομένα) της μεθοδολογίας με πεδίο εφαρμογής την Ελληνική γλώσσα καλύπτοντας ένα σημαντικό κενό στο χώρο, ii) Ο συνδυασμός χρήσης τεχνικών σημασιολογικής ανάλυσης και εξόρυξης δεδομένων, iii) Η χρήση state of the art τεχνικών στη διαδικασία της κατηγοριοποίησης των post ως προς τη σημαντικότητά τους, iv) Η μεταφορά της μεθοδολογίας σε ολοκληρωμένο σύστημα ικανό να εξάγει την πολικότητα και την αξιοπιστία φράσεων που περιέχονται σε κείμενα που θα «αλιεύονται» από το διαδίκτυο. Η Διατριβή αποτελείται από 5 Κεφάλαια. Στο Κεφάλαιο 1 περιγράφονται οι βασικές έννοιες, οι στρατηγικές των κρατών, οι τάσεις και οι δυσκολίες στην εφαρμογή της Ηλεκτρονικής Διακυβέρνησης. Το Κεφάλαιο 2 αναφέρεται στη βιβλιογραφική ανασκόπηση, για την εξόρυξη γνώμης (Opinion Mining). Στο Κεφάλαιο 3 περιγράφεται η μεθοδολογία ενώ η πειραματική αξιολόγησή της λαμβάνει χώρα στο Κεφάλαιο 4. Στο Κεφάλαιο 5 συνοψίζονται τα συμπεράσματα και οι μελλοντικές κατευθύνσεις της έρευνας. Τέλος, στο παράρτημα περιέχονται ενδεικτικά σχόλια (posts) χρηστών, τα οποία έχουν αλιευθεί από διαλόγους στο διαδίκτυο για συγκεκριμένο θέμα.
In this chapter we propose the exploration of text and data mining techniques for empowering e-government applications and services for the citizen’s benefit. In particular, we start by providing a field overview with respect to the current trends in e-government services and we demonstrate via proofs of concept the limited adaptation existing e-government applications entail. Stimulated by the need to transform e-government services to e-inclusion applications, we suggest the utilization of data mining techniques for processing the governmental data so as to extract and associate information fragments with real citizen needs and thus enable the encapsulation of the latter in future governmental decisions. To demonstrate the usability and added value of our proposed approach we have designed an interactive e-government infrastructure, the architecture of which we will present and discuss in our chapter. Moreover, we will elaborate on the system details, its adaptation capacity and we will discuss its usage benefits for both citizens and public sector bodies.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.