Recherche avancée sur les thèses de l'INSA de Lyon


Zheng, Lilei. Triangular similarity metric learning : A siamese architecture approach [en ligne]. Thèse. Villeurbanne : Institut National des Sciences Appliquées de Lyon, 2016. Disponible sur : http://theses.insa-lyon.fr/publication/2016LYSEI045/these.pdf


Domaine(s) : D02 - Informatique
Indice Dewey : 006.407 2
Langue : Anglais
Mots-clés : Informatique, Reconnaissance de formes, Fonction métrique, Apprentissage du métrique, Vérification de paires, Réduction de dimension, Visualisation de données, Similarité triangulaire, Information Technology, Pattern recognition, Metric function, Metric learning, Pariwise verification, Dimensionality reduction, Data visualization, Triangulair similarity



Directeur(s) de thèse : Baskurt, Atilla ; Idrissi, Khalid
Etablissement de soutenance : INSA de Lyon
Etablissement de co-tutelle : Université de Lyon - 2015-...., École Doctorale d'Informatique et Mathématiques - Lyon
Laboratoire : Université de Lyon - 2015-...., École Doctorale d'Informatique et Mathématiques - Lyon, LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information - Lyon, Rhône, Institut national des sciences appliquées de Lyon - Lyon, Ecole(s) Doctorale(s) : École Doctorale d'Informatique et Mathématiques (Lyon), Partenaire(s) de recherche : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Lyon, Rhône) (Laboratoire), Institut national des sciences appliquées de Lyon (Lyon) (établissement opérateur d'inscription), Laboratoire d'InfoRmatique en Image et Systèmes d'information / LIRIS (Laboratoire), Autre(s) contribution(s) : Bernadette Dorizzi (Président du jury) ; Atilla Baskurt, Khalid Idrissi, Bernadette Dorizzi, Stéphane Marchand-Maillet, Nicolas Thome, Christophe Garcia, William Puech (Membre(s) du jury) ; Stéphane Marchand-Maillet, Nicolas Thome (Rapporteur(s))
Numéro national de thèse : 2016LYSEI045
Date de soutenance : 2016

Accès au format Numérique libre, PDF
Accès
au format papier, disponiblités des exemplaires

Droits réservés, utilisation gratuite, conditions générales



Résumé français : Dans de nombreux problèmes d apprentissage automatique et de reconnaissance des formes, il y a toujours un besoin de fonctions métriques appropriées pour mesurer la distance ou la similarité entre des données. La fonction métrique est une fonction qui définit une distance ou une similarité entre chaque paire d éléments d un ensemble de données. Dans cette thèse, nous proposons une nouvelle methode, Triangular Similarity Metric Learning (TSML), pour spécifier une fonction métrique de données automatiquement. Le système TSML proposée repose une architecture Siamese qui se compose de deux sous-systèmes identiques partageant le même ensemble de paramètres. Chaque sous-système traite un seul échantillon de données et donc le système entier reçoit une paire de données en entrée. Le système TSML comprend une fonction de coût qui définit la relation entre chaque paire de données et une fonction de projection permettant l apprentissage des formes de haut niveau. Pour la fonction de coût, nous proposons d abord la similarité triangulaire (Triangular Similarity), une nouvelle similarité métrique qui équivaut à la similarité cosinus. Sur la base d une version simplifiée de la similarité triangulaire, nous proposons la fonction triangulaire (the triangular loss) afin d effectuer l apprentissage de métrique, en augmentant la similarité entre deux vecteurs dans la même classe et en diminuant la similarité entre deux vecteurs de classes différentes. Par rapport aux autres distances ou similarités, la fonction triangulaire et sa fonction gradient nous offrent naturellement une interprétation géométrique intuitive et intéressante qui explicite l objectif d apprentissage de métrique. En ce qui concerne la fonction de projection, nous présentons trois fonctions différentes: une projection linéaire qui est réalisée par une matrice simple, une projection non-linéaire qui est réalisée par Multi-layer Perceptrons (MLP) et une projection non-linéaire profonde qui est réalisée par Convolutional Neural Networks (CNN). Avec ces fonctions de projection, nous proposons trois systèmes de TSML pour plusieurs applications: la vérification par paires, l identification d objet, la réduction de la dimensionnalité et la visualisation de données. Pour chaque application, nous présentons des expérimentations détaillées sur des ensembles de données de référence afin de démontrer l efficacité de notre systèmes de TSML.


English abstract : In many machine learning and pattern recognition tasks, there is always a need for appropriate metric functions to measure pairwise distance or similarity between data, where a metric function is a function that defines a distance or similarity between each pair of elements of a set. In this thesis, we propose Triangular Similarity Metric Learning (TSML) for automatically specifying a metric from data. A TSML system is loaded in a siamese architecture which consists of two identical sub-systems sharing the same set of parameters. Each sub-system processes a single data sample and thus the whole system receives a pair of data as the input. The TSML system includes a cost function parameterizing the pairwise relationship between data and a mapping function allowing the system to learn high-level features from the training data. In terms of the cost function, we first propose the Triangular Similarity, a novel similarity metric which is equivalent to the well-known Cosine Similarity in measuring a data pair. Based on a simplified version of the Triangular Similarity, we further develop the triangular loss function in order to perform metric learning, i.e. to increase the similarity between two vectors in the same class and to decrease the similarity between two vectors of different classes. Compared with other distance or similarity metrics, the triangular loss and its gradient naturally offer us an intuitive and interesting geometrical interpretation of the metric learning objective. In terms of the mapping function, we introduce three different options: a linear mapping realized by a simple transformation matrix, a nonlinear mapping realized by Multi-layer Perceptrons (MLP) and a deep nonlinear mapping realized by Convolutional Neural Networks (CNN). With these mapping functions, we present three different TSML systems for various applications, namely, pairwise verification, object identification, dimensionality reduction and data visualization. For each application, we carry out extensive experiments on popular benchmarks and datasets to demonstrate the effectiveness of the proposed systems.