Attention sélective en visualisation d'images fixes et animées affichées sur écran : modèles et évaluation de performances - application

Cette étude traite de la modélisation de l'attention visuelle pré-attentive (ou plus communément appelé Bottom-Up) sur images fixes couleurs et sur séquence d'images animées. Il s'agit donc de déterminer de façon automatique et en utilisant uniquement des caractéristiques visuelles de...

Description complète

Enregistré dans:
Détails bibliographiques
Auteurs principaux : Le Meur Olivier (Auteur), Barba Dominique (Directeur de thèse), Le Callet Patrick (Directeur de thèse)
Collectivités auteurs : Université de Nantes 1962-2021 (Organisme de soutenance), Université de Nantes Faculté des sciences et des techniques (Autre partenaire associé à la thèse), École doctorale sciences et technologies de l'information et des matériaux Nantes (Ecole doctorale associée à la thèse), Centrale Nantes 1991-.... (Autre partenaire associé à la thèse), École nationale supérieure des mines Nantes 1990-2016 (Autre partenaire associé à la thèse)
Format : Thèse ou mémoire
Langue : français
Titre complet : Attention sélective en visualisation d'images fixes et animées affichées sur écran : modèles et évaluation de performances - application / Olivier Le Meur; sous la direction de Dominique Barba; co-encadrant Patrick Le Callet
Publié : [S.l.] : [s.n.] , 2005
Description matérielle : 1 vol. (204 f.)
Condition d'utilisation et de reproduction : Publication autorisée par le jury
Note de thèse : Thèse doctorat : Automatique et Informatique appliquée. Traitement du signal et des images : Nantes : 2005
Sujets :
Documents associés : Reproduit comme: Attention sélective en visualisation d'images fixes et animées affichées sur écran
Particularités de l'exemplaire : BU Sciences, Ex. 1 :
Titre temporairement indisponible à la communication

LEADER 07512cam a2200553 4500
001 PPN096141395
003 http://www.sudoc.fr/096141395
005 20240829055200.0
029 |a FR  |b 2005NANT2063 
035 |a (OCoLC)491947602 
100 |a 20060209d2005 k y0frey0103 ba 
101 0 |a fre  |d fre  |d eng  |2 639-2 
102 |a FR 
105 |a a m 000yy 
106 |a r 
181 |6 z01  |c txt  |2 rdacontent 
181 1 |6 z01  |a i#  |b xxxe## 
182 |6 z01  |c n  |2 rdamedia 
182 1 |6 z01  |a n 
200 1 |a Attention sélective en visualisation d'images fixes et animées affichées sur écran  |e modèles et évaluation de performances - application  |f Olivier Le Meur  |g sous la direction de Dominique Barba  |g co-encadrant Patrick Le Callet 
210 |a [S.l.]  |c [s.n.]  |d 2005 
215 |a 1 vol. (204 f.)  |c ill.  |d 30 cm 
316 |5 441092104:25499007X  |a Titre temporairement indisponible à la communication 
320 |a Bibliogr. f. 193-202 
328 |b Thèse doctorat  |c Automatique et Informatique appliquée. Traitement du signal et des images  |e Nantes  |d 2005 
330 |a Cette étude traite de la modélisation de l'attention visuelle pré-attentive (ou plus communément appelé Bottom-Up) sur images fixes couleurs et sur séquence d'images animées. Il s'agit donc de déterminer de façon automatique et en utilisant uniquement des caractéristiques visuelles de bas niveaux les zones attirant le regard. Nous proposons d'abord de construire un espace psycho-visuel dans lequel les signaux achromatique et chromatiques sont normalisés en fonction de leur propre seuil différentiel de visibilité. L'intérêt est ici d'exprimer les différentes caractéristiques visuelles avec la même unité, c'est à dire en terme de visibilité. Ensuite, plusieurs transformations sont effectuées pour déterminer la saillance spatiale achromatique et chromatiques, toutes basées sur une modélisation d'inspiration biologique des mécanismes perceptifs humains (suppression de la redondance locale, interactions facilitatrices de type iso-orienté et co-linéaire...). Une méthode de fusion est proposée permettrant de déduire la carte de saillance spatiale finale. L'évaluation des performances de la modélisation est réalisée en comparant nos résultats avec des résultats provenant de tests oculométriques sur un panel d'observateurs. Pour cela, trois métriques sont utilisées: le coefficient de corrélation linéaire, la divergence de Kullback-Leibler et une méthode de classification. Comparativement au modèle de L. Itti considéré comme le modèle de référence, et quelle que soit la métrique utilisée, notre modèle fournit en moyenne de meilleurs résultats. L'extension à la dimension temporelle a été réalisée permettant de détecter les zones saillantes dans les vidéo. A partir des données achromatiques de l'espace psycho-visuel, la saillance temporelle est déduite des contrastes locaux de mouvement de la séquence d'images. La fusion de la saillance spatiale et de la saillance temporelle conduit à la carte de saillance finale. A partir de nouveaux tests oculométriques, une nouvelle évaluation est alors effectuée. En moyenne, le modèle spatio-temporel de saillance détecte 77% des zones saillantes. Finalement, deux applications utilisant les cartes de saillance sont décrites. La première concerne le codage vidéo H.264 pour laquelle l'objectif est de privilégier la qualité sur les zones visuellement importantes. La seconde traite de la création d'images ou de séquences d'images miniatures permettant d'augmenter le confort visuel lorsque l'écran d'affichage est de faible taille. 
330 |a This thesis describes the modeling of the bottom-up visual attention on color pictures and image sequences. The principal aim is to automatically detect areas of an image that effortlessly attract the attention. The method presented here uses only low level visual features in order to identify the salient regions. Two saliency-based applications are described. We first propose to build a psychovisual space in which achromatic and chromatic data is normalized to its individual differential visibility threshold. This data is expressed in the same unit, namely the visibility. Several biological-based transformations that simulate the most important perception mechanisms (the long-range interactions, the modelling of cortical cells) are used to calculate the achromatic and chromatic salient values. The final saliency map is obtained by a new merging process, which combines the achromatic and chromatic maps. The performance assessment consists of comparing our results to the ground truth stemming from Eye-tracking experiments. Three metrics, linear correlation coefficient, the Kullback-Leibler divergence and a classification method, are used. Moreover, a comparison with reults coming from L. Itti's model is also conducted; the proposed approach yields in average better results, regardless of the metric used. The temporal dimension has been added to the model in order to compute the temporal saliency. The local motion is first computed from the normalized achromatic data. The dominant motion is then deduced. The local motion contrast, which is a relevant estimator of the temporal saliency, is the difference between local and dominant motion. The final spatio-temporal map is the combination of the spatial and the temporal saliency maps. The spatio-temporal model was assessed using new eye tracking experiments. On average, 77% of the salient regions are correctly detected. Two saliency-based applications, saliency-based H.264 coding and saliency-based thumbnails, have been developed. The former deals with a video compression scheme driven by a saliency map: perceptually non-important areas are subjected to higher compression than more relevant parts of the data. The latter concerns the construction of saliency-based thumbnails. The goal is to ease the image viewing on devices with limited display sizes. 
371 1 |a Publication autorisée par le jury 
456 | |0 246865954  |t Attention sélective en visualisation d'images fixes et animées affichées sur écran  |o modèles et évaluation de performances - application  |f Olivier Le Meur  |d 2005  |c Grenoble  |n Atelier national de reproduction des thèses  |p Microfiches  |s [ Grenoble thèses] 
606 |3 PPN027634493  |a Perception visuelle  |2 rameau 
606 |3 PPN050585908  |a Acuité visuelle  |2 rameau 
606 |3 PPN035817321  |a Compression vidéo  |2 rameau 
606 |3 PPN027791785  |a Illustrations  |2 rameau 
608 |3 PPN027253139  |a Thèses et écrits académiques  |2 rameau 
686 |a 004  |2 TEF 
686 |a 620  |2 TEF 
700 1 |3 PPN096141190  |a Le Meur  |b Olivier  |f 1975-...  |4 070 
701 1 |3 PPN060368837  |a Barba  |b Dominique  |4 727 
701 1 |3 PPN060370068  |a Le Callet  |b Patrick  |f 19..-....  |4 727 
711 0 2 |3 PPN026403447  |a Université de Nantes  |c 1962-2021  |4 295 
711 0 2 |3 PPN033124884  |a Université de Nantes  |b Faculté des sciences et des techniques  |4 985 
711 0 2 |3 PPN068720513  |a École doctorale sciences et technologies de l'information et des matériaux  |c Nantes  |4 996 
711 0 2 |3 PPN03063525X  |a Centrale Nantes  |c 1991-....  |4 985 
711 0 2 |3 PPN033236720  |a École nationale supérieure des mines  |c Nantes  |c 1990-2016  |4 985 
801 3 |a FR  |b Abes  |c 20231214  |g AFNOR 
979 |a SCI 
930 |5 441092104:25499007X  |b 441092104  |j g 
991 |5 441092104:25499007X  |a Exemplaire modifié automatiquement le 18-07-2024 18:38 
998 |a 449432