Skyblog est la plateforme emblématique des communautés adolescentes sur le web français des années 2000. Suite à l’annonce de sa fermeture en 2023, la BnF a lancé une collecte visant 12 millions de blogs et 40 téra-octets de données. Le projet Skybox vise à développer une épistémologie de l'archive web en prenant cette collection comme terrain d’étude.

Présentation

Le projet Skybox propose de développer une épistémologie de la collection des skyblogs en tant que source. La collecte des 12 millions de blogs est effectuée dans le cadre de la production courante du dépôt légal de l’internet, et à terme les fichiers collectés seront accessibles via l’application Archives de l’internet, à partir d’une recherche par URL. Or il est difficile pour un utilisateur de connaître et produire à l’avance une liste d’URLS de skyblogs sans appui documentaire et méthodologique.

Des outils d’accès aux archives web tels que l’indexation plein texte ou les parcours guidés ont été développés par la BnF dans le cadre d’accompagnement de projets de recherche. Ils permettent une meilleure découvrabilité, mais ne se révèleront pas forcément opérants pour les archives des skyblogs. Une indexation plein texte représenterait une opération lourde, dont la faisabilité technique n’est pas acquise. En outre, l’utilisation abondante du langage SMS par les skyblogueurs rend sans doute illusoire son utilisation pour des recherches thématiques et lexicales. La constitution de parcours guidés requiert une expertise scientifique en histoire et sociologie des médias et pose des questions éthiques, dès lors que des profils de skyblogueurs, adolescents à l’époque, seraient mis en avant.

Face à ce défi, l’enjeu du projet est de faire des archives des skyblogs un terrain d’étude de la donnée en tant que support à l’analyse et la production de connaissances scientifiques.

La BnF en tant que porteur du projet et l’École nationale des chartes - PSL qui en porte la composante scientifique se donnent pour objectif de développer la connaissance scientifique des skyblogs grâce à la création d’un espace de travail collaboratif de type bac-à-sable intitulé « Skybox ». Il s’agit de créer des sous-corpus, des visualisations, des cartographies et de rendre compte des caractéristiques essentielles de l’archive. Le projet peut s’appuyer sur les données techniques de production, mais également celles déposées par le producteur. 

L’accueil de travaux de recherche à la BnF est l’objectif final du projet. Chaque année un axe thématique de travail sera retenu en concertation avec le comité de pilotage. Plusieurs sujets ont déjà été identifiés (genre, santé, culture numérique) et pourraient permettre de dépasser la bibliographie existante essentiellement basée sur une approche microsociologique de la plateforme. Une proposition de stage de M2 TNAH sera publiée chaque année et l’archive sera proposée comme sujet d’étude dans les AAP du BnF DataLab. Le travail sur les skyblogs initie à ce titre une histoire du web français des années 2000 et s’inscrit dans la continuité des travaux menés par le groupe Web90 sur la décennie précédente. Une collecte sera dédiée aux « technologies du web des années 2000 », permettant notamment de préserver dans les archives des versions anciennes d’applications (player, navigateur). Enfin, un cycle de conférences reviendra sur la décennie Skyblog et conclura le projet.

Financement

  • Financement d’un stage de M2 TNAH par an pendant 3 ans (6 900€).
  • Recrutement d’un chargé de recherche pour 1 an (48 600€).
  • Vacations étudiantes (assistant de recherche) sur 2 ans (3 150€).

Budget global du projet

  • Financement plan quadriennal BnF (recrutements, stages, développements) : 99 700 €
  • Apports (valorisation RH partenaires)
    • BnF : 55 750 €
    • ENC : 64 000 €

Coût total du projet : 219 450 €

Carnet de recherche

Carnet de recherche « Web Corpora. Explorer les archives de l'internet à la BnF »
 

Consulter le carnet de recherche

Référent(s) école

Partenaire(s)

Partager sur les réseaux sociaux

Les autres projets de recherche