Déstructuration et restructuration de l’archive à l’ère numérique

Je reprends ici les principales idées de mon keynote à la journée d’étude sur « Le goût de l’archive à l’ère numérique » organisée par Caroline Muller et Frédéric Clavert à la Maison des Sciences de l’Homme de Bretagne le 5 novembre 2019.

Mon champ de recherche est l’histoire des relations économiques internationales. J’ai travaillé sur les crises de la dette souveraine, l’émergence de la gouvernance globale, et surtout le développement de l’Union économique et monétaire (UEM) en Europe de 1957 à 1992. Cette dernière thématique occupe le plus clair de mon temps dans le cadre du project EURECON, financé par une Starting Grant du European Research Council (ERC) depuis 2017.

Gestes numériques quotidiens

J’ai toujours travaillé avec un appareil photo. Il n’y a guère que pour mon mémoire de Master, en 2005, où je n’ai pu que prendre des notes en salle de lecture puisque je travaillais sur un fonds aux archives diplomatiques françaises et qu’à l’époque, malheureusement, celles-ci n’autorisaient pas encore les photos. J’ai commencé ma thèse en 2006, et j’ai depuis lors toujours pris des photos en archives. Heureusement les exceptions sont de plus en plus rares : les archives nationales allemandes à Coblence autorisent les photos depuis l’année dernière, les archives portugaises depuis cette année ; et les archives diplomatiques françaises se sont finalement converties à l’usage de l’appareil photo à l’occasion du déménagement au nouveau site de La Courneuve, au début des années 2010. Les archives présidentielles françaises, consultables sur dérogation pour les fonds Pompidou, Giscard, et Mitterrand, n’autorisent que la prise de notes, et sont désormais l’une des très rares exceptions en Europe. A l’extrême opposé, j’ai rarement pu utiliser des fonds déjà numérisés. Ceux de la Margaret Thatcher Foundation sont une exception ; de plus en plus de fonds aux archives historiques de l’Union européenne à Florence (mais aussi à Bruxelles) sont numérisés, mais la norme reste toutefois la prise de photos.

Jusqu’à encore récemment, je me contentais de transformer mes photos d’une boîte d’archives en un fichier PDF, et ensuite de prendre des notes sur un document Word en au fur et à mesure de ma lecture du fichier PDF. Mes deux principaux outils étaient alors ‘Ctrl + F’ et Spotlight, puisque j’ai toujours travaillé sur Mac. ‘Ctrl + F’ me permettait de rechercher à l’intérieur d’un fichier Word ; Spotlight permet en quelque sorte de « googliser » l’entièreté de son Mac (non seulement les titres des fichiers mais aussi leur contenu). Prise de notes et rédaction étaient entremêlés : je dupliquais mon fichier de prise de notes pour ensuite le retravailler, afin de pouvoir citer certains passages ou reformuler certaines notes, et écrire mon analyse. Le fichier de travail ressemblait un peu à l’exemple en illustration, avec une table des matières des références d’archives et quelques notes prises au fil de la lecture. Le plus important pour moi était de bien marquer à quelle page se trouve quel document, afin de pouvoir retrouver l’original si nécessaire.

De la sorte, je n’ai jamais eu de difficulté à retrouver une source ; et je n’ai jamais rien perdu. Quand j’ai découvert Tropy, j’ai trouvé le logiciel sans aucun doute séduisant. Mais pourquoi changer ? Mon système fonctionnait. Et quand je lisais la phrase d’appel du site de Tropy, « bring order to your research », j’étais incroyablement vexé : ma recherche est organisée !

Mais comme je l’expliquais dans un billet récent, mon projet ERC se développant, j’étais confronté à une nouvelle problématique dans ma recherche, à savoir celle des discussions autour de la création d’un système d’assurance dépôts européen. En bref, pour ne pas reprendre ici mon autre billet, mon problème était le suivant : les discussions afférentes à l’assurance-dépôt appartiennent au thème plus général de la régulation et de la supervision bancaire, mais se retrouvent à la fois sous d’autres thématiques (protection du consommateur, faillite bancaire) et surtout en termes de localisation des sources, dans des dépôts d’archives très divers (banques centrales, ministères des finances, Commission européenne…). Comment retrouver les 200, 300 pièces d’archives qui formeraient à terme ma base de réflexion, au milieu des milliers, voire plutôt dizaines de milliers d’autres documents qui sont, de près ou de loin, lié au sujet ? Et comment bien indexer ces documents afin de pouvoir retracer une discussion qui, comme elle n’a pas abouti, n’a finalement pas laissé de traces dans des sources secondaires ? En plus de ces questions, s’ajoutait l’objectif général de mon projet ERC, qui consiste à consulter les sources d’archives de tous les États membres de la Communauté économique européenne (CEE), soit 12 pays, auxquels s’ajoutent les sources des institutions de la CEE, et le tout sur 35 années, de 1957 à 1992.

L’arrivée de Tropy dans ma boîte à outil d’historien

C’est en réfléchissant à ces questions que j’ai décidé de me lancer dans Tropy, et d’indexer de façon systématique tous les documents que j’avais et qui ont trait à la régulation et à la supervision bancaire (afin de pouvoir les retrouver plus tard), en ajoutant un tag deposit insurance lorsque je trouvais un document sur l’assurance dépôt, afin de pouvoir me constituer un dossier uniquement sur le sujet. Cela me servait de projet pilote. J’ai désormais étendu mon indexation sur Tropy à toutes mes sources d’archives pour ce projet. Pour donner un ordre de grandeur, mon fichier Tropy contenait hier 94631 photos, regroupées en 17286 objets (items), et le fichier seul « pèse » 156,6 Mo.

Avant l’indexation dans Tropy, j’ai dû affiner l’étape du travail sur inventaire. Les pratiques des archives varient d’un dépôt à l’autre, et cela nécessite, de mon point de vue d’utilisateur, une harmonisation. Par exemple, on doit rechercher l’inventaire des archives nationales britanniques et irlandaises par mots-clefs, alors que ceux des archives diplomatiques françaises sont encore en version papier (en tout cas pour mon objet de recherche). Dans les cas britanniques et irlandais, il faut donc, référence par référence, remonter l’arborescence de l’inventaire pour en comprendre la logique et ne pas prendre le risque de manquer une référence pertinente. L’ajout de nouvelles références n’est absolument pas transparent, et il faut procéder à une nouvelle recherche pour découvrir les mises à jour. Beaucoup de centres offrent des méthodes « mixtes » : papier pour les inventaires finalisés, mots-clefs pour les périodes récentes, ou l’inverse. Quoiqu’il en soit, cela m’imposait de chercher une forme d’harmonisation de mes recherches. Je l’ai fait au moyen d’un simple tableur Excel (la capture d’écran ci-dessous en montre un exemple), listant les références potentiellement pertinentes trouvées dans les inventaires, restant toujours au plus près de la logique de l’archive d’origine, et indiquant ce que j’ai fait par la suite avec les références qui m’intéressaient : prises en photos, indexées dans Tropy, ou simplement consultées mais écartées. Cette dernière colonne revient à un total « de contrôle » de l’état de ma recherche, et permet de compter les dossiers que j’ai consulté, qui ne m’ont pas paru au final pertinent, et que je n’ai donc pas indexé dans Tropy.

En 2019 – contrairement à 2006 – j’ai donc deux étapes clairement distinctes : une première qui consiste à « inventorier l’inventaire », et une seconde qui m’amène à indexer les photos dans Tropy. La première étape existait déjà en 2006 mais elle était moins poussée, du fait de l’absence de la deuxième.

L’indexation dans Tropy, à proprement parler, est rapide, comme je l’expliquais dans mon billet de juin dernier. Au tout début de mon utilisation de Tropy j’avais tendance à renseigner le plus possible de champs de métadonnées ; j’ai finalement réalisé que cela ne m’avançait à rien, et me contente désormais de renseigner le titre, et la date (en plus bien évidemment du nom du dépôt d’archive et de la cote de la boîte). Dans certains cas je renseigne plus de champs (notamment la référence d’un document, ou le nom d’un auteur s’il est important), mais mon objectif premier est de procéder à une forme de screeningdes fonds, et de les aiguiller le plus vite possible vers des tags précis, tout en renseignant les métadonnées de base (titre et date) qui me permettront de retrouver la source facilement.

De Tropy à la rédaction

Une fois que j’ai pris quelques notes – en m’étonnant au passage de continuer à beaucoup recopier, alors même que la photo s’affiche sous mes yeux, ce qui évoque malgré la différence de contexte les remarques d’Arlette Farge sur le recopiage des sources dans son Goût de l’archive – je tagge les documents selon trois grandes catégories, développées au fil de l’eau : des tags thématiques (« régulation bancaire », « Europe sociale », « coordination des politiques économiques »… en somme des thèmes qui seront probablement les chapitres du livre final), des tags fonctionnels(« compte-rendu de réunion », « liste des participants », « CV » ces deux derniers tags étaient particulièrement important pour la partie prosopographique de ma recherche), et finalement des tags « d’urgence » (très simples : un tag « à lire » pour des document que je n’ai pas le temps sur le moment de lire dans le détail, ou sur lesquels je veux pouvoir revenir calmement en priorité sous peu), et un tag « gem », qui dénote une petite perle trouvée dans un document et que je veux absolument mettre de côté car je la citerai probablement dans la monographie finale du projet). L’étape de réflexion devient alors une navigation constante entre les tags « d’urgence », la recherche à granularité très fine par la date, et la recherche d’un ou plusieurs document(s) précis par mots-clefs.

L’écriture après l’indexation est pour moi l’étape la plus difficile et incertaine au moment où j’écris ces lignes. Mon expérience est encore faible, et consiste en deux articles, dont un en cours sur l’assurance-dépôt. Mon utilisation des « listes » dans Tropy est encore incertaine, si ce n’est pour mettre de côté des éléments taggés précédemment comme je l’ai fait pour l’assurance dépôt. Au-delà de cette utilisation plus que modeste (du moins pour le moment) des fonctionnalités offertes par Tropy, ma rédaction alterne entre mes notes dans Tropy et mon fichier Word. J’ai ainsi été confronté à un nouveau phénomène : la page blanche ! Jamais jusqu’alors je ne m’étais retrouvé face à une page blanche puisque je dupliquais mon fichier de notes et reprenait ma rédaction au sein de ce double. Je ne sous-entend pas que cette nouvelle page blanche soit un problème. Je n’ai pas développé d’angoisse insurmontable face à elle et, de toute façon, au vu des défis liés aux sources primaires de mon projet ERC, je n’ai guère le choix que d’utiliser Tropy, et d’adapter ma stratégie d’écriture en fonction. Mais cette page blanche implique un changement, justement, dans la stratégie d’écriture : une nouvelle concentration face à la nécessité d’écrire, de but en blanc, mes idées dans le fichier (plutôt positif à mon sens) ; un retour très fréquent au copier-coller de mes notes de Tropy dans le document Word (plutôt frustrant) ; une proximité inédite entre mon écriture et la source primaire, que je peux retrouver et revoirbeaucoup plus facilement que je ne le pouvais dans mon ancien système (plutôt plaisant).

Entre le début de ma thèse en 2006 et aujourd’hui, mes pratiques numériques ont donc beaucoup évolué. S’il existait déjà en 2006, mon travail sur inventaire c’est considérablement affiné et systématisé, en partie en réaction à l’évolution asynchrone des pratiques archivistiques à travers l’Europe, entre recherche par mots-clefs et recherche sur inventaire intégral papier. L’étape d’indexation dans Tropy est entièrement nouvelle, et m’offre une facilité de recherche dans la source primaire qui, si je pouvais y parvenir par le passé, n’avait pas la même fluidité, et ne serait plus réellement possible aujourd’hui vue la taille de mon corpus.