Combien de pages ? Voilà une question que se posent plusieurs candidats à la maîtrise ou au doctorat quand vient le temps de rédiger leur mémoire ou leur thèse. «Les universités québécoises offrent peu de réponses aux étudiants», a constaté Jean-Hugues Roy au cours de la rédaction de son propre mémoire, déposé en septembre dernier à l’Université Laval. Pour le plaisir, le professeur de l’École des médias s’est penché sur la longueur moyenne des mémoires et des thèses produits par les universitaires québécois depuis 1990. Ses découvertes pourraient ouvrir la porte à d’autres études du genre.
Féru de mégadonnées et programmeur à ses heures, Jean-Hugues Roy s’est inspiré de Marcus Beck, de l’Université du Minnesota, qui avait réalisé le même exercice au sein de son institution. L’ancien journaliste de Radio-Canada a été plus ambitieux. «J’ai tenté de couvrir l’ensemble des 18 universités québécoises, mais les données étaient suffisantes dans seulement 13 des dépôts institutionnels consultés», précise-t-il. Une douzaine de scripts en langage Python lui ont permis d’amasser un échantillon de plus de 55 000 documents – environ 40 000 mémoires et 15 000 thèses.
Selon ses compilations, le mémoire de maîtrise rédigé au Québec au cours des 25 dernières années fait en moyenne 133,3 pages, tandis que la thèse de doctorat compte en moyenne 251,3 pages. «J’ai exclu des thèses ou des mémoires de recherche-création qui ne comptaient que quelques pages – accompagnés d’œuvres d’art, par exemple –, ainsi que les mémoires rédigés sous forme d’articles ou les essais doctoraux, trop courts pour être comparés à l’ensemble. J’ai toutefois conservé les documents très longs qui contenaient de volumineuses annexes, lesquelles font partie intégrante de la thèse ou du mémoire.»
Un titre de 378 caractères!
Parmi les 13 institutions de son échantillon, l’UQAM est celle où les thèses sont les plus longues et elle se classe au troisième rang pour la longueur des mémoires. Quelques statistiques ont attiré son attention, comme le fait que 10 thèses publiées depuis 1990 comptent plus de 1000 pages ! «Le record appartient à un diplômé en didactique de l’Université de Montréal pour une thèse de 1578 pages déposée en 2011. Près de 1200 pages sont des annexes», note-t-il. La thèse la plus courte? Quarante-six pages, publiée en 2002 au Département de mathématiques de l’Université de Sherbrooke. «Le mémoire le plus long, publié en 1990 à l’UQAC en gestion des petites et moyennes organisations, compte 744 pages. Et le plus court fait 19 pages et a été publié en 1994 au Département de mathématiques de l’Université Concordia.»
Jean-Hugues Roy n’a pas observé de variations significatives de la longueur des ouvrages dans le temps, mais il a noté avec amusement que les titres s’allongent. «Celui d’une thèse en psychologie déposée en 2012 à l’Université Laval compte 378 caractères!», souligne-t-il. L’ouvrage s’intitule «Stress maternel prénatal et développement précoce : données de naissance, attention et sécrétion cortisolaire à trois mois. Association entre le stress maternel prénatal, l’âge gestationnel et le poids de naissance du bébé : une analyse d’études prospectives. Association entre le stress maternel prénatal, l’attention/éveil et la sécrétion cortisolaire de l’enfant à trois mois».
En utilisant la Classification révisée des domaines scientifiques et technologiques de l’OCDE pour regrouper les 687 départements, programmes ou profils de son échantillon initial en un peu plus de 100 disciplines uniformisées, Jean-Hugues Roy a pu faire la distribution de la longueur des thèses et mémoire par département. «Les mémoires les plus longs sont produits en management et en gestion, tandis que les plus courts sont en finance. C’est en droit que les doctorants sont les plus prolifiques et en mathématiques et en statistique qu’on est le plus laconique. Ce n’est pas étonnant, car le record mondial du Ph.D. défendu avec la thèse la plus courte est détenu par un mathématicien: 9 pages pour un doctorat obtenu au MIT en 1966», relate-t-il.
Le professeur n’a pu s’empêcher de lire ici et là quelques extraits de mémoires et de thèses au fil de son étude. «Ce sont des ouvrages qui renferment des tonnes de connaissances, de découvertes et de réflexions sur une foule de sujets, remarque-t-il. On ne comprend pas toujours tout ce qu’on y lit, car chaque discipline a ses références et son vocabulaire, mais il y en a certains qui sont plus accessibles que d’autres et réellement fascinants!»
Le journalisme de données
Les données recueillies par Jean-Hugues Roy, qui ont fait l’objet d’un article dans la revue Découvrir de l’Acfas, recèlent sans doute d’autres trésors et le principal intéressé aimerait bien étendre son échantillon à l’ensemble des universités canadiennes.
«L’un de mes objectifs était également de fournir à mes étudiants, particulièrement ceux du cours Technologies de l’information appliquées au journalisme, des exemples concrets de mégadonnées exploitables», note-t-il. Dans ce cours, il enseigne aux futurs journalistes les rudiments de l’extraction de données (data scraping) et du traitement des bases de données à l’aide de logiciels (data journalism). Les étudiants doivent y apprendre quelques notions de programmation de base, une matière aride pour certains. «C’est très différent de ce à quoi ils sont habitués car la programmation de code doit être infaillible. Un point-virgule au mauvais endroit peut compromettre un script, illustre-t-il. Mais les étudiants comprennent rapidement qu’il y a là une niche spécialisée qui est peu occupée présentement en journalisme.»
Selon le chercheur, nous voyons poindre les humanités numériques, comme on a vu naître la bioinformatique ou la linguistique informatique. «Celles-ci émanent du croisement entre les sciences humaines et sociales et les outils informatiques permettant l’exploitation de toutes ces mégadonnées», conclut-il.