Recherche avancée sur les thèses de l'INSA de Lyon


Ouji, Asma. Segmentation et classification dans les images de documents numérisés. Thèse. Villeurbanne : Institut National des Sciences Appliquées de Lyon, 2012. Disponible à la Bibliothèque Marie Curie.


Domaine(s) : D02 - Informatique
Indice Dewey : 006.420 72
Langue : Français
Mots-clés : Informatique, Reconnaissance d'images, Images scannées, Segmentation physique, Analyse colorimétrique, Classification, Classement, Information Technology, Image recognition, Digitized image, Layout segmentation, Color analysis, Classification, Clustering



Directeur(s) de thèse : Baskurt, Atilla ; Lebourgeois, Frank
Etablissement de soutenance : INSA de Lyon
Etablissement de co-tutelle : École Doctorale d'Informatique et Mathématiques - Lyon
Laboratoire : Institut national des sciences appliquées de Lyon - Lyon, École Doctorale d'Informatique et Mathématiques - Lyon, LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information - Lyon, Rhône, Ecole(s) Doctorale(s) : École Doctorale d'Informatique et Mathématiques (Lyon), Partenaire(s) de recherche : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Lyon, Rhône) (Laboratoire), Autre(s) contribution(s) : Patrick Lambert (Président du jury) ; Atilla Baskurt, Frank Lebourgeois, Patrick Lambert, Jean-Marc Ogier, Catherine Viard-Gaudin, Pierre-François Besson (Membre(s) du jury) ; Jean-Marc Ogier, Catherine Viard-Gaudin (Rapporteur(s))
Numéro national de thèse : 2012ISAL0044
Date de soutenance : 2012

Accès au format papier, disponiblités des exemplaires
Droits réservés, utilisation gratuite



Résumé français : Les travaux de cette thèse ont été effectués dans le cadre de l'analyse et du traitement d'images de documents imprimés afin d'automatiser la création de revues de presse. Les images en sortie du scanner sont traitées sans aucune information a priori ou intervention humaine. Ainsi, pour les caractériser, nous présentons un système d'analyse de documents composites couleur qui réalise une segmentation en zones colorimétriquement homogènes et qui adapte les algorithmes d'extraction de textes aux caractéristiques locales de chaque zone. Les informations colorimétriques et textuelles fournies par ce système alimentent une méthode de segmentation physique des pages de presse numérisée. Les blocs issus de cette décomposition font l'objet d'une classification permettant, entre autres, de détecter les zones publicitaires. Dans la continuité et l'expansion des travaux de classification effectués dans la première partie, nous présentons un nouveau moteur de classification et de classement générique, rapide et facile à utiliser. Cette approche se distingue de la grande majorité des méthodes existantes qui reposent sur des connaissances a priori sur les données et dépendent de paramètres abstraits et difficiles à déterminer par l'utilisateur. De la caractérisation colorimétrique au suivi des articles en passant par la détection des publicités, l'ensemble des approches présentées ont été combinées afin de mettre au point une application permettant la classification des documents de presse numérisée par le contenu.


English abstract : In this thesis, we deal with printed document images processing and analysis to automate the press reviews. The scanner output images are processed without any prior knowledge nor human intervention. Thus, to characterize them, we present a scalable analysis system for complex documents. This characterization is based on a hybrid color segmentation suited to noisy document images. The color analysis customizes text extraction algorithms to fit the local image properties. The provided color and text information is used to perform layout segmentation in press images and to compute features on the resulting blocks. These elements are classified to detect advertisements. In the second part of this thesis, we deal with a more general purpose: clusternig and classification. We present a new clustering approach, named ACPP, which is completely automated, fast and easy to use. This approach's main features are its independence of prior knowledge about the data and theoretical parameters that should be determined by the user. Color analysis, layout segmentation and the ACPP classification method are combined to create a complete processing chain for press images.