kriptia.com
Google
 


Accueil > SCIENCES TECHNOLOGIQUES > TECHNOLOGIE DE L'INFORMATIQUE >

VISION

Español | English | Deutsche
8 tesis en 1 páginas: 1
  • TEXTURE RECONNAISSANCE DANS DIVERSES GÉOMÉTRIES D'IMAGERIE.
    Auteur: LLADÓ BARDERA XAVIER.
    Année: 2003.
    Université: GIRONA.
    Lieu de l'exposition: ESCUELA POLITÉCNICA SUPERIOR.
    Lieu de préparation: ESCUELA POLITÉCNICA SUPERIOR.
    Résumé: La vision est sans doute dominer notre sens qui découlent de la plupart des informations monde qui nous entoure. Grâce à la vision, nous voyons comment les choses sont, là où ils sont et comme mueven.En les images que nous voyons avec notre système de vision peut extraire les caractéristiques de couleur, la texture et la forme, et avec l'aide de cette information, nous sommes en mesure de reconnaître les objets, même lorsque Ils sont perçus dans des conditions totalement différentes. Par exemple, des points de vue différents à l'observateur distances, les conditions d'éclairage, etc. Le Computer Vision tente d'imiter la vision humaine du système grâce à un système de capture d'images, d'un ordinateur et logiciel. L'objectif recherché n'est rien de moins que la desrrollar un sistma capable de comprendre une image de la même manière que le ferait un personne. Cette thèse porte sur elanálisis la paire effectuer la reconnaissance de texture superdficies.La motivation première est de résoudre le problème de la classification des surfaces de texture lorsqu'ils ont été pris sous sistintas condiciones.En Ce document présente une description détaillée du système de reconnaissance basé sur un modèle 3D de la surface ( Qui comprend des informations sur la couleur et la forme), qui est ensuite utilisée pour produire de nouvelles images 2D des textures en vertu de la nouvelle condiciones.Estas images virtuelles qui sont générés sont le fondement de notre système de reconnaissance, comme il est utilisé comme modèles referenia pour les textures classificateur. Le projet de système de reconnaissance combine les matrices Coocurrencia pour l'extraction des caractéristiques de la texture, avec l'utilisation d'un proche Nieghbour Classifer. Cette classification nous permet de reconnaître les différentes textures et dans le même temps obtenir une approximation de la direction de l'éclairage dans les images utilisées pour valider le système. Les résultats obtenus dans les différentes expériences montrent la faisabilité du système genración la texture, ainsi que le système de reconnaissance.
  • NON LINÉAIRE DE LA REPRÉSENTATION DES IMAGES BASÉE SUR LE SYSTÈME VISUEL HUMAIN ET ADAPTÉS À LA NATURE DES STATISTIQUES DES IMAGES
    Auteur: Valerio Cascajo Roberto.
    Année: 2004.
    Université: POLITÉCNICA DE MADRID.
    Lieu de l'exposition: E.T.S. INGENIEROS TELECOMUNICACION.
    Lieu de préparation: E.T.S.I. Telecomunicación.
    Résumé: Dans cette thèse, nous développons un schéma de représentation d'images multi-inspiré dans le traitement des non-linéaire information dans le système visuel humain. Cette partie du travail de Simoncelli et collaborateurs montrent que les principales étapes de ce processus, composé d'un stade multi-filtrage linéaire (Gabor, ondelettes, etc.) Suivie d'une normalisation des divisions non-linéaire, pourrait conduire à des réponses de neurones statistiquement indépendants, ce qui est très souhaitable de propriété dans une représentation de l'image. Eltrabajo a été fait à la première place dans une analyse systématique du modèle proposé par ces auteurs, et une formulation en utilisant l'information mutuelle (MI) comme paramètres de l'unité statistique. En conséquence, nous avons démontré que les réponses prédites par ce modèle sont statistiquement pas totalement indépendants les uns des autres, mais, de manière surprenante, les départs semblent être indépendantes de la quasi-totalité des entrées. Même si nous avons vu qu'il n'est pas possible de parvenir à une totale indépendance entre voisins réponses, nous avons constaté que, dans la pratique, la condition minimale de la messagerie instantanée semble être très proche de zéro. Suite à cette analyse, nous avons résolu le problème d'environ optimiser les paramètres du modèle libre, c'est-à-dire de calculer les valeurs qui minimisent la dépendance des statistiques (IM) entre voisins réponses. Cela a particularisée est l'expression générale d'un modèle gaussien, dont nous avons déjà vérifié empiriquement avec une série d'images naturelles. Le schéma de représentation image résultante est extrêmement robuste et flexible, il soutient diverses modifications suboptimal renforcement de certaines de ses fonctionnalités pour les applications qui le requièrent. Tout cela a été empiriquement par le biais du brevet correspondant implémentations et résultats numériques. Une fois testé et mis en oeuvre la normalisation de division l'une des principales contributions a été de résoudre le problème de l'inversion de la transformation non-linéaire. Cela a été proposé et mis en œuvre un régime d'investir directement, qui peut être obtenue en assouplissant légèrement statut d'indépendance statistique, initialement imposées. Être résolus par invertibilidad, schéma de la représentation peut être considérée comme polyvalente, présente des avantages évidents en raison de leur plus grande pertinence et la compatibilité de perception et indépendance statistique entre les échantillons voisins. Nous avons mis l'accent sur deux applications spécifiques: (1) Le développement d'une métrique perceptive de la qualité de l'image et (2) l'inclusion de la non-linear phase d'un codec JPEG 2000 pour améliorer la qualité visuelle de la reconstruction.
  • FORMULATION DE LES CONTOURS ACTIFS DANS LE DOMAINE DE L'ANALYSE DE FRÉQUENCE ET DE LA CONVERGENCE DE LA SEGMENTATION D'IMAGE.
    Auteur: VERDÚ MONEDERO RAFAEL.
    Année: 2005.
    Université: POLITÉCNICA DE CARTAGENA.
    Lieu de l'exposition: POLITÉCNICA DE CARTAGENA..
    Lieu de préparation: ANTIGUO HOSPITAL DE MARINA, CAMPUS MURALLA DEL MAR UPCT.
    Résumé: Les contours actifs paramétriques ou des serpents, sont un cas particulier de modèles déformables intégrés dans le plan de l'image. Leur fundamentaos mathématiques représentent la confluence de la géométrie, la physique et la théorie de Rapprochement. Depuis ses débuts en 1987, l'utilité de serpents a été testée et éprouvée dans l'analyse d'images médicales, de l'image de segmentation, dans le suivi des objets en mouvement dans des séquences vidéo, et ainsi de suite. Un problème majeur à résoudre est le comportement dynamique du serpent lorsque celui-ci se déplace vers sa résolution finale de l'équilibre. Cette analyse de la convergence est particulièrement nécessaire lorsque le contour actif régissant fonctionnelles dépend de paramètres ou caractéristiques, le plus souvent non linéaire, les deux forces internes et externes au contour de l'inflation et étiré comme dépendant de la structure elle-même. La conception du comportement dynamique totale est nécessaire de contrôler la définition de la puissance fonctionnelle d'assurer que les commentaires ne donne pas lieu à un comportement instable. Dans cette thèse a été révisé à formuler les contours actifs dans le domaine spatial, y compris des modèles paramétriques, les modèles et les adapter à la topologie repose sur l'articulation du niveau (niveau fixe). Nous avons décrit les problèmes posés par l'application de la classique des contours actifs (initialisation de la sensibilité, la robustesse contre le bruit, la sélectivité dans la segmentation et le suivi des objets, les conditions d'arrêt dans la procédure itérative, etc) et les solutions possibles sont actuellement à l'art. La conception de modèles déformables espace a été déplacée dans le domaine de fréquence et a été utilisée pour analyser la vitesse de convergence. De cette analyse donne une méthode pour les règles de conception des paramètres optimaux d'une dynamique de contour actif pour la segmentation d'objets dans des images. La méthode de conception optimale des paramètres dynamiques de contour actif a été testé dans des applications de segmentation et le suivi d'objets dans des séquences d'images en vue d'accélérer la vitesse de convengencia de emph () serpent. La méthode a été intégrée dans la mise en oeuvre de mouvement, de la caractérisation mécanique des muscles artificiels et le filtrage des vecteurs mouvement dans un cadre non rigide méthode d'inscription en utilisant les modèles déformables. La contribution principale de cette théorie est l'analyse des taux de convergence des contours actifs et d'une méthode paramétrique pour établir les valeurs de leur dynamique paramètres permettant de contrôler l'évolution des contours d'un problème de la segmentation d'image. Une autre contribution de cette thèse est la traduction de la formulation classique des modèles déformables, dans le domaine spatial, dans le domaine de fréquence, offrant une nouvelle perspective pour la conception et l'analyse de ces éléments. L'extension de l'analyse au cas des surfaces déformables pour accélérer la vitesse de convergence, ainsi que l'exportation des idées soulevées dans l'analyse de l'application en commun de niveau technique, sont les principaux axes de recherche future.
  • VLSI ARCHITECTURE POUR L'ESTIMATION DE MOUVEMENT DANS L'IMAGERIE SOUS-MARINE.
    Auteur: Ila Viorela Simona.
    Année: 2005.
    Université: GIRONA.
    Lieu de l'exposition: Universidad de Girona.
    Lieu de préparation: Universidad de Girona.
    Résumé: Le travail réalisé dans cette thèse fournit des solutions novatrices dans le domaine du traitement de l'image sous-marine. Dans un tel contexte, la tâche de traitement de l'image est compliquée par le manque de bien défini les contours en raison de la souillure de l'image d'une part et la nécessité d'un système d'éclairage artificiel qui produit un éclairage non uniforme. L'estimation de la circulation du véhicule ainsi que sa localisation sont deux problèmes fondamentaux de la robotique sous-marine. Une façon de résoudre ces problèmes en utilisant un système de vision par ordinateur. Les systèmes de vision sont caractérisés par leur haute résolution, à faible coût et le fait fournir une grande quantité d'informations. L'estimation de la circulation est de la corrélation entre deux images acquises par une caméra montée sur le véhicule et orienté océanique. La corrélation peut être obtenue en utilisant des techniques de "correspondants". Cette thèse propose un algorithme permettant de détecter la corrélation entre les images en temps réel. Les deux principales contributions de cette thèse est d'une part, une méthode qui permet d'améliorer l'algorithme de "correspondants" en lui fournissant plus de robots, et deuxièmement, la mise en œuvre de l'algorithme en matériel dans le but d'obtenir une performance en temps réel . Du point de vue algorithmique, la thèse propose l'utilisation de la texture caractéristiques pour éliminer les fausses corrélation (appelé "aberrantes") entre deux photos, d'améliorer la robustesse de l'algorithme de "correspondants" et permettant d'améliorer les résultats de la motion algorithm Qu'il est très sensible à la fausse corrélation. La technique proposée dans cette thèse a été obtenu par une étude avec un grand nombre d'expériences pour choisir l'opérateur de texture plus adaptés au traitement de l'image sous-marine. En comparaison avec les méthodes existantes, la nouvelle proposition est beaucoup plus faible coût de calcul et élimine le besoin d'une estimation a priori, du mouvement. Pour rendre l'application de l'algorithme de détection en corrélation matériel a conçu une architecture parallèle qui accélère les performances dans le but de produire un bénéfice pour la vitesse vidéo. La conception de l'architecture a été faite sur la base d'une étude réalisée dans les architectures VLSI utilisés pour l'estimation du mouvement dans les applications multimédia vidéo de l'encodage. Dans le cas particulier de vues sous-marines, il a été déterminé qu'il doit y avoir une corrélation approche fondée sur une mesure de similarité plus complexe, compte tenu de la valeur moyenne des intensités pour chaque point. Cette approche est appelée "Mean Normalized Cross Correlation" et présente l'avantage d'être robuste dans le cas d'un éclairage non uniforme. La mise en oeuvre proposée fait composé de deux parties principales: la première est un algorithme dans le matériel pour sélectionner les points d'intérêt en temps réel et de l'autre côté d'une architecture parallèle à détecter la corrélation entre les éléments appartenant à des images consécutives. La vérification de la mise en œuvre a été réalisée en utilisant des plates-formes dispositifs reprogramables FPGA fondée. L'architecture proposée se caractérise par sa grande flexibilité, ce qui permet le changement de paramètres, et de sa grande efficacité en rapport ressources / exécution.
  • NOUVELLES CONTRIBUTIONS REPRÉSENTATIONS SOBRECOMPLETAS DES IMAGES INSPIRÉES PAR L'ARCHITECTURE FONCTIONNELLE DU CORTEX VISUEL PRIMAIRE
    Auteur: Fischer Sylvain.
    Année: 2006.
    Université: POLITÉCNICA DE MADRID.
    Lieu de l'exposition: E.T.S. DE INGE. DE TELECOMUNICACION.
    Lieu de préparation: ESCUELA TECNICA SUPERIOR INGENIEROS TELECOMUNICACIÓN.
    Résumé: Cette thèse a pour objectif d'explorer certains parallèles entre l'architecture et les domaines fonctionnels principaux de traitement de l'image visuelle. Un premier objectif est d'améliorer les modèles existants de la vision biologique repose sur la théorie de l'information. Une seconde est le développement de nouveaux algorithmes de traitement d'images basé sur la vision naturelle. Les données disponibles sur le système visuel couvrant les études physiologiques et psychiques, la Gestalt psychologie et les statistiques des images naturelles. La thèse se concentre principalement sur les représentations sobrecompletas (c'est-à-dire des représentations qui augmentent la dimensionnalité des données) pour les raisons suivantes. Premièrement, ils permettent de dépasser les inconvénients significatifs orthogonal transformation, et la seconde parce que les modèles de la vision biologique ont souvent besoin d'être sobrecompletos et troisièmement parce que construire des représentations sobrecompletas efficace et pertinente des problèmes de mathématiques roman, en particulier le problème de éparpillés approximations. La première thèse propose une transformation log-ondículas Gabor auto-inversible inspiré réceptif terrain et l'organisation des cellules multiresolución simple cortex visuel primaire (V1). Cette transformation offre des résultats prometteurs pour l'élimination du bruit. Deuxièmement, les interactions constatées entre les cellules V1 composé d'inhibition latérale et à la facilitation entre lignée cellulaire ont montré efficace pour extraire le naturel bords de l'image. Troisièmement, la redondance introduite par la transformation sobrecompleta est réduite grâce à un algorithme dédié rapprochement qui construit une représentation clairsemée rares images en se basant sur leurs bords. Pour une decorrelación plus loin et d'atteindre des taux de compression plus élevé, les bords alignés le long des contours continus sont codés de manière prévisionnelle par les chaînes de coefficients, qui fournit une représentation efficace des contours. Enfin, il présente une étude sur la fermeture des contours en utilisant la méthode du tenseur de vote. Nous proposons l'utilisation d'itérations et de l'information de courbure pour améliorer la robustesse et la qualité perçue des méthodes existantes.
  • NOUVELLES CONTRIBUTIONS EN FUSION ET DE COMPRESSION D'IMAGES BASÉ SUR DES REPRÉSENTATIONS ESPACIO - FRECUENCIALES
    Auteur: Redondo Tejedor Rafael.
    Année: 2006.
    Université: POLITÉCNICA DE MADRID.
    Lieu de l'exposition: ETSI TELECOMUNICACIÓN.
    Lieu de préparation: ETSI Telecomunicación.
    Résumé: Les représentations communes ont connu un swing au cours des dernières décennies, tant et si bien qu'il n'ya pas de domaine dans le traitement de signaux qui n'ont pas été utilisés. À l'intérieur de la mer de représentations existent dans la littérature, dont l'un concerne le travail actuel: l'application log-Gabor proposé dans [70, 68]. Son faible chevauchement, haute sensibilité d'orientation et d'évolutivité, invarianza au Transporteur, auto-invertibilidad et de la définition complexe conférer l'efficacité, de polyvalence et de robustesse contre le bruit et l'apparition d'artefacts. Au-delà de l'étroite ressemblance des filtres sobrecompletos log-Gabor la zone corticale V1 ainsi que la modélisation du comportement de l'inhibition neuronale ou de facilitation et de permettre à un codage pauvres approximación pour obtenir l'image basée sur l'extraction de la plus marquants coindidentes normalement avec les contours . Ce type de représentation, fondée sur des contours multi-trace une nouvelle voie pour résoudre taréas traitement de l'image, à savoir la compression d'images et de fusion. Un nouveau paradigme postule une grande efficacité de compression si les éléments caractéristiques de la images sont codées séparément, tels que luminosité, la forme ou la texture [19, 145, 240]. Suite à ce paradigme, dans cette thèse a proposé une nouvelle méthode de compression basée sur codifier ces contours multi extraites de la faible transformation log-Gabor. Étant donné la nature de ces traits, un algorithme de chiffrement des chaînes a été spécialement conçu en fonction de la stochastique et morphologiques caractéristiques de ces contours. À cette fin, les différentes techniques et les codes prefjos prédictive et arithmétique ont été regroupées en fonction de chaque alphabet. En outre, l'algorithme proposé offre une gamme complète de système de compression, y compris la codification des résidus paso-bajo cabezeras placement et de l'intrigue. Ce regroupement est basé sur les modèles du cortex visuel primaire en vue d'atténuer les distorsions généralement produits par la compression des normes de compression JPEG ou JPEG2000. Le descomposiciones multiresolución ont démontré leur supériorité par rapport à d'autres techniques traditionnelles de la fusion d'images. Toutefois, il n'existe aucune preuve de l'hégémonie, souvent dû à l'absence d'une image de référence. Dans cette thèse, les différents types d'ondelettes sont comparés à s'identifier avec succès les filtres de Gabor, qui n'avait jamais été utilisée auparavant en raison de son manque de précision de reconstruction. En outre, un algorithme de régimes multiresolución appelé fenêtres multitamaño a été proposé, qui adapte la taille de la fenêtre à l'caractéristiques locales dans l'image, en exploitant les avantages des deux fenêtres, petites ou grandes ou exactes et fiables, ce qui réduira considérablement les erreurs dans les cartes de décision Contrairement aux techniques classiques fenêtre de taille fixe. Enfin, une nouvelle méthode axée sur les contours a été proposé d'intégrer le système de fusion des contours multi multiresolución. Cet algorithme basé sur les traits sensibiliad réduit le bruit, les effets de flou et d'artefacts de l'alignement.
  • - MODÈLE DE LOCALISATION DES VÉHICULES ET DES CONTOURS VISUELS
    Auteur: PONSA MUSSARRA DANIEL.
    Année: 2006.
    Université: AUTÓNOMA DE BARCELONA.
    Lieu de l'exposition: ESCOLA TÈCNICA SUPERIOR D'ENGINYERIA.
    Lieu de préparation: ESCOLA TÈCNICA SUPERIOR D'ENGINYERIA (ETSE-UAB).
    Résumé: Cette thèse s'attache à l'analyse de séquences vidéo, en appliquant les techniques de modèle pour l'extraction des informations quantitatives. En particulier, nous faisons plusieurs propositions dans deux domaines d'application: forme de suivi basées sur le contour des modèles, et à la détection et le suivi des véhicules en images captées par une caméra installée sur une plate-forme mobile. Les travaux de suivi consacré à la forme suit les contours du paradigme actif, qui nous présente un examen des approches existantes. Tout d'abord, nous mesurons la performance des algorithmes les plus communs (en fonction des filtres de Kalman et de filtres à particules), puis nous évaluons les aspects de son application à travers une vaste étude expérimentale, où plusieurs séquences synthétiques sont pris en compte, avec différents degrés de distorsion de bruit. Ainsi, nous avons établi que la meilleure façon de mettre en pratique ces algorithmes classiques de suivi, et nous en identifier les avantages et les inconvénients. Ensuite, le travail est axé sur l'amélioration du suivi de contour algorithmes basés sur les filtres à particules. Ces algorithmes d'atteindre de bons résultats à condition que le nombre de particules est suffisamment élevée, mais malheureusement le nombre requis de particules augmente exponentiellement avec le nombre de paramètres à estimer. Par conséquent, et dans le contexte du suivi de contour, nous présentons trois variantes du filtre à particules classique, qui correspondent aux trois nouvelles stratégies pour faire face à ce problème. Tout d'abord, nous proposons d'améliorer le suivi de contour en propageant avec plus de précision les particules d'une image à la suivante. Cela se fait en utilisant un rapprochement linéaire de la propagation de la fonction optimale. La deuxième stratégie proposée est basée dans le cadre de l'estimation des paramètres analytique. Ainsi, nous visons à faire un usage plus productif des particules, réduisant la quantité de paramètres qui doivent être estimés à travers eux. La troisième méthode proposée vise à exploiter le fait que, dans le contour de suivi des applications, les paramètres liés à la transformation rigides peuvent être estimées avec suffisamment de précision indépendamment de la déformation locale présenté par le contour. Elle est utilisée pour effectuer une meilleure propagation des particules, en se concentrant de manière plus forte densité dans la zone où le suivi de contour est situé. Ces trois propositions sont validées abondamment dans les séquences avec les différents niveaux de bruit, dont l'amélioration est parvenu à évaluer. Après cette étude, nous nous proposons de traiter directement avec l'origine des précédents problème en réduisant le nombre de paramètres à estimer dans le but de suivre une certaine forme d'intérêt. Pour arriver à cela, nous proposons d'utiliser le modèle de la forme de multiples modèles, où chacun a besoin d'un plus faible quantité de paramètres que lors de l'utilisation d'un modèle unique. Nous proposons une nouvelle méthode pour apprendre de ces modèles d'une série de formation, et d'un nouvel algorithme d'utiliser les modèles obtenus pour suivre les contours. Les résultats expérimentaux certifier la validité de cette proposition. Enfin, la thèse se concentre sur le développement d'un système de détection et de suivi des véhicules. Les propositions comprennent: un module de détection des véhicules, un module consacré à la détermination de la position en trois dimensions et de la vitesse des véhicules détectés, et un module de suivi de la mise à jour de l'emplacement des véhicules sur la route d'une précision et efficacité. Plusieurs contributions originales sont réalisées dans ces trois sujets, et les performances de ces empiriquement est évaluée.
  • ROBUSTE DENSITÉ DE DONNÉES STATISTIQUES ET TECHNIQUES DE LA VIDÉO ET 3D LADAR ANALYSE D'IMAGES.
    Auteur: Felip Rodríguez Ramon Lluís.
    Année: 2006.
    Université: AUTÓNOMA DE BARCELONA.
    Lieu de l'exposition: Escola Tecnica Superior d'Enginyeries.
    Lieu de préparation: Universidad Autónoma de Barcelona.
    Résumé: La plupart des situations rencontrées par les techniques de la Vision par ordinateur doit traiter des ensembles de données qui sont contaminés par le bruit et contenant un grand nombre d'éléments qui peuvent être considérés comme erronés quant aux résultats souhaités. Ce fait est encore plus évidente quand il s'agit d'une estimation paramétrique description des éléments pour décrire les données. Les techniques capables de travailler avec des éléments afectador pour les erreurs et le bruit sont nécessaires dans ces cas. Les statistiques et de solides algorithmes basés sur les données les densités sont conçues pour résoudre ces problèmes et permettre l'estimation de modèles paramétriques bien que des données fiables présenté erreurs. Cette thèse présente la mise au point de nouveaux algorithmes estiamación paramètres et les aspects techniques ainsi que la mise en œuvre des algorithmes classiques et de nouvelles propositions sur Computer Vision tâches traitant de données contaminées.
8 tesis en 1 páginas: 1
kriptia.com
E-mail