Jean-Émile SYMPHOR, Alban MANCHERON, Lionel VINCESLAS et Pascal PONCELET : Le FIA : un nouvel automate permettant l'extraction efficace d'itemsets fréquents dans les flots de données. In Proceedings of the 8th Extraction et Gestion des Connaissances (EGC), volume RNTI-E-11 (1) de Revue des Nouvelles Technologies de l'Information, pages 157-168. Cépaduès-Éditions, 2008.

Le FIA (Frequent Itemset Automaton) est un nouvel automate qui permet de traiter de façon efficace la problématique de l'extraction des itemsets fréquents dans les flots de données. Cette structure de données est très compacte et informative, et elle présente également des propriétés incrémentales intéressantes pour les mises à jour avec une granularité très fine. L'algorithme développé pour la mise à jour du FIA effectue un unique passage sur les données qui sont prises en compte tout d'abord par batch (i.e., itemset par itemset), puis pour chaque items par item. Nous montrons que dans le cadre d'une approche prédictive et par l'intermédiaire de la bordure statistique, le FIA permet d'indexer les itemsets véritablement fréquents du flot en maximisant le rappel et en fournissant à tout moment une information sur la pertinence statistique de itemsets indexés avec la P-valeur.

bib | slides | pdf | ps ] Back