6 janvier 2013 | Blog, Blog 2013, Communication | Par Christophe Lachnitt
Comment gérer les archives des réseaux sociaux ?
Twitter fait imploser la Bibliothèque du Congrès américain.
En 2010, la Bibliothèque du Congrès avait annoncé son intention d’archiver tous les tweets jamais publiés sur Twitter. C’était pour l’institution une manière de démontrer son modernisme. Malheureusement, elle a annoncé il y a quelques jours, ainsi que l’a relaté BuzzFeed, qu’elle rencontrait de sérieux problèmes à cet égard.
Le problème ne concerne pas tant l’archivage proprement dit des tweets – il est bel et bien opérationnel – que la recherche dans les archives ainsi constituées. La simple recherche d’un terme pourrait prendre 24 heures pour la seule période entre 2006 et 2010.
La Bibliothèque du Congrès a ainsi dû décliner les demandes d’environ 400 chercheurs qui voulaient utiliser ces archives pour leurs travaux. Naturellement, les archives ne seront jamais complètement publiques par respect pour la vie privée des utilisateurs de Twitter.

La magnifique Bibliothèque du Congrès à Washington – (CC) Christophe Lachnitt
La Bibliothèque du Congrès a besoin de moyens bien supérieurs pour améliorer la capacité de recherche dans ces archives, ce qui passerait par la mise en place de centaines, voire de milliers, de serveurs afin de permettre aux logiciels de recherche de fonctionner. Cela ne rentre pas dans les capacités financières d’une telle institution.
Cependant, l’archivage mené à bien n’a pas beaucoup de sens s’il est impossible d’effectuer la moindre recherche. Twitter permet progressivement à ses utilisateurs d’archiver leurs propres tweets mais cela n’a évidemment pas le même intérêt que l’ensemble des tweets du monde entier. Ne nous y trompons pas en effet : la possibilité d’analyser l’histoire d’une période donnée à partir de tous les tweets publiés constituerait une révolution pour les sciences dites molles.
Au fait, cet article est mon 800ème publié sur Superception. Mais je n’ai pas encore les problèmes d’archivage de Twitter. 😉