|
||
|
|
Au cours de mes recherches et développement effectués au sein d'une équipe du CNRS, j'ai publié dans une conférence francophone et deux conférences internationales. Conférence francophone - Conférences internationales - Manuscrit de thèse - Rapport de soutenance GRETSI’01 L. Brunel, P. Mathieu, « Méthode rapide de segmentation et d’indexation du flux MPEG1-2 par bloc DCT », Groupe de Recherche et d’Étude de Traitement du Signal et des Images, Toulouse, France, septembre 2001, volume 360. Résumé : L’accessibilité des données multimédias est tributaire d’une indexation précise, ce qui demande un temps très long. Cet article propose une nouvelle méthode pour renseigner de façon automatique plusieurs champs MPEG7 (par exemple, le mouvement de la caméra et des objets). Nous exploitons au maximum les informations contenues dans le flux MPEG1-2. Afin d’accélérer le calcul, les images ne sont pas décompressées, mais nous nous limitons au décodage entropique et à la quantification inverse. Les informations de mouvement présentent dans le flux MPEG1-2 permettent d’estimer le mouvement apparent de la caméra. La segmentation des zones de couleur est obtenue grâce à un algorithme de division fusion. Les valeurs des coefficients DCT sont aussi utilisés. Poster présenté à la conférence ICME’03 L. Brunel, P. Mathieu, “Fast method of segmentation and indexing MPEG1-2 flow”, IEEE International Conference on Multimedia & Expo, Baltimore, USA, juillet 2003. Poster présenté à la conférence VCIP’03 L. Brunel, P. Mathieu, “Fast method of segmentation and indexing MPEG1-2 flow”, SPIE Visual Communications and Image Processing, Lugano, Suisse, juillet 2003, vol. 5150, pp. 1985-1994. Manuscrit de thèse : "Indexation vidéo par l'analyse de codage" (6 Mo) (en haute résolution 9 Mo) - au format html Ce travail de thèse porte sur l'indexation, normalisée par MPEG7, de séquences vidéos. A partir d'un flux MPEG1-2, ou de tout autre codec basé sur la prédiction de mouvement et la DCT, sans totalement le décompresser, nous exploitons l'analyse effectuée lors du codage. Ainsi de façon non-supervisée et en quasi temps réel, nous proposons une méthode d'estimation du mouvement de la caméra ainsi que d'extraction des objets en déplacement. Pour l'estimation du mouvement de la caméra, nous utilisons les vecteurs de prédiction temporelle présents dans le flux. L'étude des images d'erreur nous permet d'en évaluer la pertinence. Pour la détection des objets en mouvement, nous segmentons tout d'abord la séquence en zones de couleur uniforme directement sur les coefficients DCT. Nous établissons une distance colorimétrique, non seulement entre deux pixels voisins d'une image, mais aussi entre deux images successives, ce qui définit une zone en trois dimensions. Afin de segmenter plus précisément et de régulariser les contours sur chaque image, nous utilisons les B-Splines. Chaque objet candidat est déformé par la présence de tous ses voisins à partir d'un potentiel de couleur, ce qui, itérativement, permet d'éliminer les zones trop réduites. En
combinant le mouvement de la caméra, les vecteurs de prédiction et les zones
de couleur 2D+t, nous réalisons une fusion adaptative de façon à obtenir une
bonne représentation des objets.
<< La thèse de Lionel Brunel, soutenue le 30 mars 2004 a porté sur l'indexation vidéo par l'analyse de codage. Lionel Brunel a présenté ses travaux avec un exposé bien illustré et un grand souci pédagogique. Lionel Brunel a développé une approche originale d'analyse d'images à partir de flux compressés. Les réponses précises aux questions techniques du jury montrent la maîtrise de Lionel Brunel sur son domaine de recherche. Pour l'ensemble de ces raisons, le jury est unanime pour décerner à Lionel Brunel le titre de docteur de l'Université de Nice - Sophia Antipolis, mention très honorable. >> |
||||||||||||||||