Sur le travail du son
Daniel Deshays : Comment peut-on décider de ne mettre ni musique, ni voix-off sur un film documentaire ? De choisir de faire confiance aux sons eux-mêmes, à leur durée et à l’espace ?
Nicolas Philibert : Ce que j’essaie de raconter se passe généralement de commentaires. Mes films ne s’élaborent ni à partir d’une parole intime ni à partir d’une somme de connaissances qu'ils’agirait de déployer, mais à partir d’un « non savoir ». Quand je commence un film, j’ai un désir de quelque chose, un point de départ, mais je ne connais pas le point d'arrivée. C’est à partir de cette fragilité que s’échafaude mon travail.
D. D. : Mais comment le son se construit-il alors ? Comment se pense-t-il ?
N. Ph. : La plupart du temps, ma façon d'aborder le son est très empirique. En tournage, sauf cas particulier, je ne pense pas « le son » de façon autonome, comme une entité abstraite, déconnectée de l’image, des situations. On sait bien que faire un cadre, c’est déterminer du hors champ, donc du son off . J'ai grandi dans une famille où la musique comptait beaucoup, et suis toujours resté attentif aux sonorités, aux timbres, aux intonations, aux accents. Si j’accorde une grande importance au son, ça ne passe pas forcément par une élaboration théorique, une pensée du son qui préexisterait de façon massive aux situations concrètes. Presque tous mes films, explicitement ou non, tournent autour du thème de la parole ou la langue : La Voix de son maître, sur le discours patronal, Le Pays des sourds, La Moindre des choses… Jusqu’à Retour en Normandie que je réalise actuellement, où certaines personnes ont de grandes difficultés de langage. Quand j’ai tourné La Ville Louvre, l’idée de rendre certaines répliques inaudibles et d’en dégager une dimension comique s’est élaborée presque « par défaut ». L’acoustique de certaines salles du musée est si catastrophique que je ne pouvais pas lutter contre. Il a bien fallu que j’en prenne mon parti. Ceci étant, je déplore que le son soit presque toujours assujetti à l'image. Personnellement j'aime inverser cette hiérarchie. Il m’arrive souvent de monter, voire de tourner une séquence non pas pour l’image, mais pour le son. Je me souviens qu’au début du montage de La Voix de son maître, devant la masse de rushes que nous avions accumulée - 40 heures d’entretiens avec des grands patrons - Mordillat et moi avions commencé à travailler sur papier, à partir du décryptage des entretiens. On avait choisi les passages qui nous semblaient les plus intéressants, et on les avait mis bout à bout selon un ordre qui nous semblait très cohérent. Mais dès qu’il s’est agi de monter les plans selon cette organisation, on s’est rendu compte que ça ne marchait pas. Du point de vue du sens, c’était sans doute très clair, très logique, mais c’était indigeste et plat. Nous n’avions pas pris en compte ce qui est peut-être l’essentiel : les intonations, les voix, la scansion, la musique des mots, le débit de la parole, la gestuelle… C’est là que j’ai pris conscience de l’importance du son comme matière sensible.
D. D. : Comment préparez-vous le son d’un tournage ? Dans quelle mesure est-ce possible de préparer le son ? Par exemple, dans La Ville Louvre le long trajet de cette femme qui descend dans les sous-sols avec des chaussures à talon, c’est une idée que vous aviez élaborée avant de tourner ?
N. Ph. : En tournant au Louvre, j’avais été frappé par la façon qu’avaient les gens de se déplacer dans les salles, ces espaces qui en imposent, où on peut se sentir un peu inhibé devant ces centaines d’œuvres, même quand on est employé là. Dans ces salles il y a naturellement beaucoup de réverbération, et le moindre bruit est amplifié. Chacun essaie donc de se déplacer avec discrétion, mais il y a toujours une latte de parquet qui se met à couiner, quelqu’un qui éternue… Et tout le monde se retourne. J'ai donc eu envie de montrer ça et, en quelque sorte, de faire « parler » les matériaux. Il y a d’ailleurs une scène assez cocasse où un couple procède à des essais d’acoustique en tirant des coups de pistolet en l’air, ce qui m’a valu une copieuse engueulade de la part d’une escouade de gardiens qui, attirés par le vacarme, se sont précipités sur place, et nous découvrant en train de filmer, ont cru que j’avais fait venir des acteurs et provoqué la scène. On a souvent dit que ce film avait un côté tatiesque et je pense que cela vient en partie de là, du fait qu’au lieu de la contenir, j'ai cherché à tirer parti de cette réverbération qui déforme les sons, qui les rend un peu pâteux, où les mots deviennent presque incompréhensibles. Mais la comparaison s’arrête là puisque chez Tati, c’est prévu, écrit à l’avance et non « subi ». Au Louvre, vous avez des sols en marbre, des carrelages, des dalles de pierre, du parquet, des tapis ; et dans les sous-sols, vous aurez aussi des dalles en béton, du ciment, de la terre battue, du sable et des assemblages de planches… tous ces matériaux produisant, quand on marche dessus, une grande diversité de sons. Il y a donc cette séquence où une jeune archéologue s’enfonce dans les entrailles du musée en empruntant une suite de couloirs, un escalier, des labyrinthes, des souterrains… Et à ma demande, en effet, elle porte des chaussures à talons pour que le bruit de ses pas scande la séquence et traduisent les différents matériaux du sol… La force de la scène vient donc bien davantage du son que de l’image, dans ce côté mécanique, extrêmement régulier des pas, où le son change, se transforme chaque fois qu’elle passe d’un type de sol à un autre.
D. D. : Peut-on choisir le décor d’un tournage dans le documentaire pour le son ? Choisissez-vous un lieu plutôt qu'un autre, une place particulière ou une distance particulière ou bien vous ne le pensez pas comme ça ? Est-ce qu’on décide d’un cadre pour une proximité nécessaire au son, pour ne pas mettre de HF par exemple ?
N. Ph. : Je crois que les décisions techniques, esthétiques et politiques que nous prenons forment un tout, lui-même indissociable des relations qu'on établit avec les gens qu'on filme. Il peut y avoir parfois contradiction entre ces différents aspects, mais quand je me rapproche des gens que je filme, ce n’est pas pour éviter de mettre un HF, ça n’a rien à voir avec des considérations techniques.
D. D. : Si l’on désire accorder plus de crédit au son direct – attendu les difficultés d’en restituer les qualités, sans pouvoir trop préparer, ni installer la prise de son – dispose-t-on toujours d’autant de liberté avec l’image (de distance, de type de cadrage, etc.) ? Je pense à Jean-Pierre Duret par exemple, qui peut établir son cadre à partir d'un point d'écoute. Quand il le peut, il organise sa prise de son – choix du lieu et de l’acoustique à une distance souhaitée du sujet et de là il cadre… le point de vue se soumettant aux conditions de l'écoute…même si ce n’est jamais si tranché.
N. Ph. : Je trouve ça très intéressant. Chez moi, ce n’est pas érigé en principe général, mais il m'arrive souvent de penser une séquence en fonction ou à partir d’un son. À l'échelle d'un film tout entier, c’est plus rare, mais c’est tout de même le cas du Pays des sourds, où par définition la question du son constitue – en creux – le sujet même du film.
D. D. : Le sonore n'apparaît jamais finalement, on voit un film, on n'écoute pas un film. Il n'y a pas de conscience du sonore. Si le sonore travaille derrière c'est qu'on a tout fait pour que le film se constitue à partir du sonore, mais il n'apparaîtra jamais pour lui-même. Pourtant dans certaines conditions de qualité de travail du son, le film obtient une force souvent supérieure aux films qui n'ont pas intégré cette dimension…
N. Ph. : À moins de jouer avec l’absence d’images, avec du noir. Dans ce nouveau film auquel je travaille, il y aura des « noirs », des moments sans images où on entendra une voix.
D. D. : Dans Être et avoir, alors qu’on sait la difficulté d’en effectuer la prise de son dans une salle de classe – même très silencieuse – tout demeure très audible, tout reste clair, comment êtes-vous parvenu à une telle prouesse ?
N. Ph. : Je retravaille beaucoup la bande son au montage, dans un sens qui me conduit bien plus à enlever qu'à ajouter… Au moment du montage son et du mixage, on vous propose toujours d’enrichir la bande son, d’ajouter des bruits, des effets. Je lutte contre cette tendance-là. J'essaye au contraire d'épurer, de dégager un peu de clarté. C’est souvent un travail de dentelle. Je passe des heures pour faire émerger un mot, un son. Ce n’est donc plus exactement du direct, c'est plutôt « à partir du direct ». Jusqu’à Être et avoir je montais mes films en « traditionnel » et dès les premiers jours j’étais sur trois bandes son. D’entrée de jeu j’avais besoin de faire des chevauchements, des superpositions, de travailler le son de façon élaborée. C’était évidemment un peu lourd, la moindre manipulation, la moindre coupe prenait du temps. Mais je peux dire que certaines séquences n’ont vu le jour que parce que je travaillais de cette façon-là. Aujourd’hui, avec l’ordinateur, le nombre de pistes son étant d'une gestion plus facile, c’est beaucoup plus confortable. Je travaille dès le départ sur six ou huit pistes, ce qui me permet de me soustraire à la linéarité des sons directs, de faire exister certaines scènes autrement, de les monter à partir des sons et non, comme c’est presque toujours le cas à partir des images.
D. D. : J'ai le sentiment qu'il y a deux types de processus de fabrication du son : on travaille selon Méliès, ou selon Lumière. Avec Méliès tout se constitue sur du silence et dans le noir : on importe les objets sonnants du monde avec lesquels on va construire un événement, comme le théâtre peut le faire, et avec Lumière, au contraire, on fait confiance au réel, on travaille dans le flux existant des bruits du monde. Quand on travaille dans les flux, et c’est le cas du documentaire, il y a trop de son, c'est-à-dire que le microphone prend beaucoup plus que ce que l'on entend. La question est alors : comment évacuer l'excédent ? Faut-il choisir des lieux calmes ?
N. Ph. : Pas nécessairement. Dans les situations où le son est très brouillé, surchargé, on peut parfois essayer d’en tirer parti, au lieu de n’y voir qu’une contrainte. Prenez une salle de classe… Contrairement à ce qu’on imagine, ce n’est pas un lieu calme. Les enfants travaillent souvent par petits groupes autonomes, et c’est finalement assez bruyant. Même dans la classe où j’ai tourné Être et avoir, avec ce maître plutôt autoritaire, c’était difficile. La différence d’âge des élèves imposait des sous-groupes et des activités simultanées bien distinctes. Les premiers jours, j’étais un peu paumé et j'avais une fâcheuse tendance à courir tous les lièvres à la fois. Je filmais caméra à l’épaule et passais d’un groupe à l’autre sans toujours bien savoir ce qui me guidait. Le résultat n’est pas glorieux. J’ai alors décidé de mettre la caméra sur pied et de bouger le moins possible, sauf s’il y avait une vraie raison de le faire. Je privilégiais une situation, un groupe ou un élève, et décidais de m’y tenir, quitte à abandonner en route si ça n’était pas « fructueux ». Le reste constituait du off, tantôt intéressant et productif, tantôt encombrant. À la différence d’un micro, notre oreille est extrêmement sélective. Nous faisons en permanence le tri entre ce que nous voulons entendre et le reste. C’est inconscient. Si on vit dans une rue très passante, on sera parfois excédé, mais avec l’habitude, on finira par ne plus y faire attention … Dans un restaurant bruyant, c’est pareil, nous faisons abstraction de tout ce qui ne nous concerne pas, pour nous concentrer sur notre conversation. Quand on fait du son c’est différent. Bien sûr on peut utiliser des micros très directionnels et « isoler » certains sons, les détacher d’un fond sonore, mais cela n’a pas la souplesse de l’oreille humaine qui elle, peut instantanément élargir ou resserrer le champ sonore avec une facilité incroyable.
D. D. : Ce qui m'a surpris c’est que, dans le cadre, tous les surgissements demeuraient toujours audibles. Alors comment travaille Julien pour obtenir une telle précision ? (Julien Cloquet, ingénieur du son de Être et avoir). Il utilise une perche ou bien il met des HF aux élèves ?
N. Ph. : Il n'était pas question de mettre des HF aux élèves. On l’a fait souvent pour l’instituteur, mais, avec les élèves, cela aurait été beaucoup trop lourd à gérer. Et synonyme d’une volonté de tout maîtriser, ce qui me paraît improductif et dangereux. Il fallait prendre des risques, accepter qu’il y ait une part de hasard, d’inattendu. Qu’il y ait des ratés, des erreurs, une certaine fragilité. C’est pour moi essentiel. Ne pas chercher à « couvrir » toute la classe, ni toutes les situations, se faire à l’idée qu’on va forcément passer à côté d’un tas de choses. C’est vrai aussi bien pour le son que pour l’image. À moins encore de chercher à les déconnecter, les rendre autonomes l’un par rapport à l’autre, ce qui peut-être passionnant. Ceci étant, Julien a fait un travail remarquable à la perche, très précis et souple, alors que les pièges étaient nombreux. Il y avait des fenêtres des deux côtés de la classe, un tableau blanc brillant, des néons au plafond, bref, les risques de reflets et d’ombres de perche étaient nombreux.
D. D. : L’autonomie du son et de l’image apparaît de manière radicale dans L'Enfant aveugle 2 (Hermann Slobbe) où Johan van der Keuken donne le micro à l'enfant aveugle pour faire le son de son film. L'enfant ne va pas faire le son du plan, il se trouve dans l’image même et dirige son micro sur des détails variant les valeurs sonores à l'intérieur même du cadre. Mais c'est peut-être le seul film où j'ai vu ça…
N. Ph. : Oui, parce que là, c'est au tournage, or la déconnexion son-image se fait souvent dans l'après-coup, au montage. Dans 99% des cas, en documentaire, on fait du son synchrone… S'en dégager ne va pas de soi, surtout au tournage. Au montage c’est déjà plus facile.
D. D. : Enfin les rares films où ça a été fait, révèlent une grande force. Je pense au Territoire des autres où tout se joue dans le décalage, l'écart, abandonnant la synchro pour tout replacer. C'est aussi la démarche de Tati, qui place ses sons pour désigner ce qu'il veut faire voir. Par le placement du son finalement il établit ce que produirait un gros plan ; et comme l’écoute est inconsciente, ça lui permet de dire « ce n’est pas moi qui vous le montre, c'est vous qui faites le trajet ». Et finalement, on pourrait utiliser ces démarches pour resonoriser les documentaires.
N. Ph. : Mais cela arrive. Moi un Noir, par exemple. Quoique ce n’est pas un documentaire.
D. D. : Mais c'est exceptionnel, la liste des films s'arrête vite. En fait, le plus souvent il sont constitués de trois couches : la voix off, la musique et le son direct. Certains réalisateurs ne mettent que deux couches, certains n'en mettent plus qu'une, soit seulement de la musique, cela peut être une espèce de partition comme Le Territoire des autres, ou seulement du direct.
N. Ph. : Ou alors, c’est un direct fortement retravaillé. Mais les trois couches que vous évoquez, il y a tant de façons de les agencer que cela peut donner les films les plus singuliers.
D. D. : Dans votre prochain film vous m’avez dit qu’il y aurait une voix off. Comment fonctionnera-t-elle, derrière la caméra comme chez Alain Cavalier, ou en véritable voix off ?
N. Ph. : Alain Cavalier prend des risques incroyables en tournant. Quand il fait le film sur Bonnard ou bien les Portraits, c’est magnifique, il parle en filmant, sans filet. Un travail de funambule. Il cherche ses mots, il bafouille un peu, mais toute la beauté de ses films est là, dans cette parole singulière, très libre, à la fois retenue, presque chuchotée, chaleureuse, et en même temps impertinente et drôle. On est à l’opposé de ces commentaires bien dits, bien tournés et souvent très lisses qui ont fait tant de mal au documentaire !
D. D. : Alors pour revenir à la question du début, comment s'est décidé le fait de ne pas parler ou de ne pas mettre – ou presque pas – de musique ?
N. Ph. : Ce sont les images, leur succession, le montage, les sons qui permettent au spectateur de se frayer un chemin, de penser, de se questionner ou de comprendre petit à petit les choses, en les associant.
D. D. : Donc c'est dans une grande confiance dans le réel ?
N. Ph. : C'est une confiance dans le spectateur. La volonté de le laisser appréhender ce qu'il voit et ce qu'il entend sans lui dire quoi penser de façon trop explicite, pour que cela puisse le saisir, le « travailler ».
D. D. : Pour faire ces choix esthétiques, quels étaient vos modèles dans l'histoire du cinéma ?
N. Ph. : Les cinéastes qui me touchent le plus sont du côté de la retenue, pas de la profusion ou du foisonnement. Je pense à Bergman, à Kiarostami, à Ozu. Je préfère les cinéastes qui suspendent le temps, qui le ralentissent, à ceux qui l’accélèrent. Quant à la musique, puisque c'était votre question de départ, elle envahit tellement les films qu’on ne l’entend plus.
D. D. : Il y a très peu de gens qui considèrent le musical comme un monde, un espace dans lequel on peut circuler avec la prise de son. Je pense qu'il y a plein de choses à faire de ce côté-là, mais ce qui est bizarre c'est que ça ne se fasse pas. Et je voudrais bien comprendre pourquoi cette liberté n’est pas prise, pourquoi cela reste des exceptions ou des moments particuliers dans une œuvre. Ce n’est pas la démarche globale d'un cinéaste, je pense à Van der Keuken. Pourquoi cela n’existe pas dans tous ses films, lui qui en a tellement conscience ?
N. Ph. : Dans l’œuvre de Van der Keuken, il y a une grande disparité de formats, de formes, d'expériences. C’est un ensemble très dense, qui traduit une envie de goûter à tous les modes narratifs. Explorer des voies nouvelles, aller vers l’inconnu, c’est toujours à la fois ce qui nous fait peur et ce qui nous attire.