2010 International Conference on Machine and Web Intelligence 2010
DOI: 10.1109/icmwi.2010.5647906
|View full text |Cite
|
Sign up to set email alerts
|

Nodes coupling in a Bayesian network for the automatic classification of XML documents

Abstract: the document classification is one of the classical task of information retrieval and it has involved numerous studies. In this paper, we are presenting a learning model for XML document classification based on Bayesian networks. This latter is a probabilistical reasoning formalism. It permits to represent depending relationships between the random variables in order to describe a problem or a phenomenon. In this article, we are proposing a model which simplifies the arborescent representation of the XML docum… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
0
0
2

Year Published

2014
2014
2014
2014

Publication Types

Select...
1

Relationship

0
1

Authors

Journals

citations
Cited by 1 publication
(2 citation statements)
references
References 5 publications
0
0
0
2
Order By: Relevance
“…Avec cette nouvelle représentation du document structuré, si un document d contient k fois un noeud « Noeud » de père « pére-Noeud », la probabilité est calculée une seule fois ensuite elle est élevée à la puissance k. Ainsi, le calcul de la probabilité structurelle se fait selon la formule suivante : Le jumelage des noeuds améliore d'une façon significative le temps de réponse du système (environ 30%). Le temps de réponse diminue avec l'augmentation de la fréquence des noeuds dans le document, Cela est due au fait que le modèle arborescent avec jumelage calcule les probabilités des noeuds identiques qui ont des pères identiques une seule fois [1].…”
Section: Jumelageunclassified
See 1 more Smart Citation
“…Avec cette nouvelle représentation du document structuré, si un document d contient k fois un noeud « Noeud » de père « pére-Noeud », la probabilité est calculée une seule fois ensuite elle est élevée à la puissance k. Ainsi, le calcul de la probabilité structurelle se fait selon la formule suivante : Le jumelage des noeuds améliore d'une façon significative le temps de réponse du système (environ 30%). Le temps de réponse diminue avec l'augmentation de la fréquence des noeuds dans le document, Cela est due au fait que le modèle arborescent avec jumelage calcule les probabilités des noeuds identiques qui ont des pères identiques une seule fois [1].…”
Section: Jumelageunclassified
“…Dans ce travail on applique la technique de « jumelage » des noeuds dans les réseaux bayésiens qui simplifie la structure arborescente du document XML, ce qui réduit le nombre de paramètres à estimer par rapport à la méthode classique. Cette technique a déjà fait l'objet d'un article précédent [1] où l'on montre qu'elle réduit le temps d'exécution de 30% par rapport aux réseaux classiques tout en préservant les mêmes performances pour la classification des documents XML en termes d'efficacité. On a appelé le modèle résultant : modèle génératif arborescent avec jumelage.…”
Section: Introductionunclassified