Eleonore ASQUITH
(Édition: Capucine FAURE)
ELAN, qui signifie EUDICO Linguistic Annotator, est un logiciel d’annotation pour du matériel visuel et audio. Il a été développé en 2000 sous un nom différent et a été relancé sous son nom actuel en 2002 par l’Institut Max Planck de psycholinguistique aux Pays-Bas. ELAN est programmé en langage Java et est compatible avec Windows, macOS et Linux. Curieusement, il n’a pas été initialement conçu comme un logiciel spécifiquement destiné à l’analyse musicale, mais plutôt comme un outil linguistique pour la recherche sur la structure et la dynamique de la communication humaine. Un large éventail de disciplines académiques a bénéficié de ce logiciel, notamment la recherche liée à la langue des signes, l’acquisition du langage chez l’enfant, la psychologie et même la musicothérapie. Néanmoins, il est particulièrement adéquat pour l’analyse de la musique de film, car la musique peut ainsi être examinée en parallèle avec ce qui se passe à l’écran grâce à un alignement temporel précis des annotations. ELAN est également bien adapté pour l’étude comparative, car il permet de lier jusqu’à quatre fichiers vidéo dans une même session.
Dans cette étude, nous utiliserons ELAN pour comparer deux scènes du film In the Mood for Love de Wong Kar-wai (花樣年華), sorti en 2001. Ce qui est intéressant dans ces deux scènes, c’est qu’elles reprennent toutes les deux la même pièce; Yumeji’s Theme de Shigeru Umebayashi. Il s’avère que, de manière très « wong kar-wai-esque », tel qu’on on peut le voir dans des films comme Chungking Express, le réalisateur choisit de répéter neuf fois la même pièce de musique tout au long du film. Les deux scènes choisies sont la première scène comprenant de la musique (5:00-6:00), et la scène finale avec Yumeji’s Theme, à l’exception du générique de fin (1:12:39-1:13:55). En utilisant ELAN, nous démontrerons comment, même si la même pièce de musique est utilisée, deux œuvres radicalemet différentes émergent à travers le geste, la couleur, l’ambiance et l’émotion.
1. Exploration des possibilités d’ELAN
Notre périple débutera par la découverte des fonctionnalités proposées par ELAN avant d’explorer comment elles peuvent être utilisées pour étudier et comparer les deux scènes d’In the Mood for Love.
1.a. Fonctionnalités
Les multiples traits distinctifs d’ELAN facilitent l’annotation et l’analyse des vidéos, ouvrant ainsi la voie à une analyse qualitative et quantitative précise. Tout d’abord, ELAN prend en charge l’annotation des modalités audio et vidéo, s’adaptant ainsi aux chercheurs manipulant une palette diversifiée de données. Les annotations de ces données peuvent être effectuées manuellement ou de manière semi-automatique, toutes synchronisées avec la chronologie multimédia. L’annotation semi-automatique implique généralement l’utilisation d’outils automatiques ou d’algorithmes pour faciliter le processus, tout en laissant place à une supervision et une correction manuelles par l’utilisateur. Pour preuve, des données générées par des logiciels tiers utilisant l’automatisation, tels que les systèmes de reconnaissance automatique de la parole (ASR), peuvent être importées dans ELAN et affinées par les utilisateurs. Ceci est possible grâce à la compatibilité d’ELAN avec une grande variété de formats de fichiers. Une autre caractéristique précieuse d’ELAN réside dans sa capacité à créer des niveaux multiples d’annotations et à organiser ces niveaux en hiérarchies. Cela découle de l’utilisation d’un format de données basé sur XML, permettant ainsi le stockage des documents d’annotation de manière élégante. XML est un langage informatique de balisage. Il permet de structurer les informations de manière hiérarchique (avec un élément racine et d’autres éléments à l’intérieur) et d’expliciter leur rôle au sein de la structure. Par exemple, ELAN peut créer des niveaux d’annotations pour la transcription et la traduction de la parole, se révélant d’une grande utilité dans l’analyse de la musique dotée de paroles.
1.b Comment utiliser le logiciel ?
En outre, comment pouvons-nous tirer parti de ce logiciel pour analyser avec finesse une scène cinématographique imprégnée de musique ? ELAN propose une interface épurée et raffinée. Pour commencer, il suffit de glisser-déposer un fichier dans le logiciel (voir ci-dessous).
Cependant, si plusieurs fichiers doivent être analysés dans une même session (jusqu’à 4 pouvant être affichés simultanément), cliquez sur « Fichier », puis sur « Nouveau » pour sélectionner plusieurs fichiers. Ceci s’est avéré particulièrement utile dans mon analyse, car j’ai pu synchroniser les deux scènes de manière à ce que la musique soit diffusée exactement en même temps, offrant une comparaison visuelle côte à côte. De plus, les fichiers vidéos ont été importés avec des fichiers wav correspondants, permettant ainsi la visualisation de la forme d’onde (voir ci-dessus). La navigation au sein des fichiers importés est facile à appréhender grâce à une série de commandes multimédias de style magnétoscope, agrémentées de fonctionnalités étendues. Vous pouvez avancer ou reculer à cinq niveaux différents :
- Par pixel
- Par image
- Par seconde
- Par ‘scrollview’
- Sauter au début ou à la fin
Des notations alignées dans le temps (basées sur un temps de début et de fin spécifique) peuvent être réalisées en sélectionnant un segment, en faisant un clic droit, puis en double-cliquant à l’endroit où une sélection et une couche alignée dans le temps se croisent. Une boîte de texte apparaîtra alors, permettant l’insertion d’une notation. La couche sur laquelle l’annotation est placée peut être hiérarchisée et ordonnée. Lorsqu’une couche est ajoutée, elle peut être assignée à un « parent », ce qui signifie qu’elle est subordonnée à une autre couche (comme illustré dans l’image ci-dessous). Lors de l’analyse de la musique de film, les couches peuvent représenter différentes catégories telles que le bruit de fond (son diégétique), la forme musicale, le mouvement de la caméra, la vitesse du mouvement ou même la synchronisation entre la musique et l’image.
Comme nous pouvons le constater dans l’analyse des scènes d’In the Mood for Love, le temps est représenté sur l’axe des abscisses, tandis que les niveaux sont représentés sur l’axe des ordonnées. L’onde sonore du thème de Yumeji se trouve au-dessus de l’axe des abscisses (auquel elle correspond). En haut à gauche se trouvent les deux vidéos, la scène 1 à gauche et la scène 2 à droite. Au fur et à mesure de la lecture des vidéos, dont la synchronisation correspond au thème de Yumeji, la forme d’onde et les notations défilent en temps réel (représentées par la ligne rouge).
2. Comparaison des deux scènes
Bien que les deux scènes diffusent exactement la même musique, elles racontent des histoires très divergentes et véhiculent des atmosphères très distinctes. Ainsi, la musique prend également une nuance légèrement modifiée à chaque occurrence. Un axiome qui pourrait être évoqué est que la même scène avec une musique différente peut engendrer de nouvelles connotations ; par exemple, une scène de personnes jouant sur une plage prend instantanément une teinte menaçante si le thème de Jaws[1] y est ajouté. Mais cela fonctionne également dans l’autre sens. Le contexte dans lequel s’inscrit la musique influe sur la manière dont nous la recevons et l’écoutons.
Yumeji’s Theme est répété neuf fois tout au long du film à des moments précis marquant la relation entre Chow Mo-wan et Su Li-zhen. Dans In the Mood for Love, le temps, représenté par Chronos, est complètement dissout, et c’est à travers la répétition de Yumeji’s Theme que nous ressentons une progression. Dans un tout autre contexte, cette répétition pourrait être considérée comme poussée à l’extrême vers la farce, cependant, il y a une belle poésie derrière ce mécanisme. Le temps n’est pas représenté par la chronologie, mais par les moments magnifiques qui jalonnent la vie d’une personne.
Les scènes choisies représentent la première et la dernière occurrence où le thème sera joué (sans compter le générique de fin). La sensualité caractérise la première scène, qui met l’accent sur les corps des personnes présentes, privilégiant les torses et les membres plutôt que les visages. Bien que la scène se déroule de nuit, elle se situe à l’intérieur et la lumière diffuse une teinte jaune chaleureuse, éclairant les contours des corps et correspondant aux sentiments joyeux et ludiques ressentis par les personnes présentes. Les magnifiques couleurs et motifs des vêtements ajoutent encore à cette scène vive et tactile. Cela contraste avec la deuxième scène, située à l’extérieur, avec un éclairage plus sombre et plus obscur. Plutôt que de se concentrer sur l’élégance des corps, cette deuxième scène met l’accent sur les émotions brutes des personnages, choisissant de se focaliser sur leurs visages (comme nous le savons, les yeux sont les fenêtres de l’âme). Nous sommes déjà confrontés à d’importantes dualités juxtaposées ; intérieur et extérieur, lumière et obscurité. Cependant, ces différences ne s’arrêtent pas là. Alors que les deux scènes commencent avec une certaine distance par rapport aux sujets à l’écran, la caméra dans la deuxième scène franchit cette frontière en s’approchant des personnes, allant même jusqu’à montrer leurs visages ou leurs mains qui se touchent. Pendant ce temps, la caméra dans la première scène reste une spectatrice, ne franchissant jamais le seuil de l’autre pièce, ne réagissant que lorsque le sujet s’en approche. Ainsi, la deuxième scène est une scène plus privée et intimement émotionnelle. Alors que la première scène est dépourvue de tout son autre que la musique, l’analyse ELAN révèle que 4 couches de son diégétique sont présentes dans la deuxième scène. De plus, alors que la deuxième scène se déroule essentiellement en temps réel, la première scène est filmée au ralenti. Cela dissout davantage les structures temporelles du film.
Les notations d’ELAN révèlent de nombreux parallèles entre les deux scènes et leurs interactions avec la musique, en particulier dans les 2e, 3e, 4e et 5e couches. Nous pouvons constater que les deux scènes ont le même mouvement de caméra, un panoramique lent vers la gauche, au début de Yumeji’s Theme. Il existe également des parallèles entre différentes images fixes, par exemple les images fixes à 0:30 montrent toutes deux le visage de Chow (voir ci-dessous). De nouveau, à 0:10, un homme et une femme côte à côte (voir ci-dessous). Cependant, dans la première scène, l’homme est le mari de Su Li-zhen et dans la deuxième scène, il s’agit de Chow.
Conclusion
En comparant les deux scènes avec ELAN, nous prenons conscience de la gamme d’émotions et d’idées que Yumeji’s Theme est capable de transmettre. Alors que dans la première scène, nous entendons une valse sensuelle, ludique et dramatique, avec l’anticipation tentante de ce qui va suivre, dans la deuxième scène, nous entendons les magnifiques violons qui deviennent troublants alors que nous réfléchissons à tous les moments passés liés au thème. Nous pleurons pour les personnages qui ne comprennent pas la trahison de leurs partenaires et qui aspirent à l’amour, incapables d’admettre leurs sentiments jusqu’à ce qu’il soit trop tard. À la fin du film, en écoutant Yumeji’s Theme, nous n’entendons plus la romance, mais plutôt la douleur, le désir ardent et les regrets.
[1] Jaws, Steven Spielberg, 1975