Contrairement à une croyance populaire, le Web n'est pas aussi éternel qu'il en a l'air. Une étude démontre ainsi que des millions de pages Internet sont effacées de la toile régulièrement, même les plus récentes.



Tout se qui se trouve sur Internet reste sur Internet à jamais. Cette croyance tenace se vérifie souvent. Il n'y a qu'à voir les nombreuses histoires de personnalités publiques rattrapées par leur passé sous la forme d'un post sur X (Twitter) ou d'un commentaire d'article datant d'il y a plusieurs années. À partir de là, il est facile de se dire que le Web est en quelque sorte éternel. Il existe bien des outils pour effacer les informations nous concernant de la toile, mais globalement, il restera toujours des traces. Du moins à première vue.

Sur ce point, la réalité est bien différente de l'idée que l'on s'en fait. Dans une étude intitulée “When Online Content Disappears” (quand le contenu en ligne disparaît dans la langue de Molière), des chercheurs constatent que des millions de pages Internet sont régulièrement effacées à mesure que les années passent. Pour s'en rendre compte, ils ont utilisé le site Common Crawl, qui archive actuellement plus de 250 milliards de pages Web. C'est en vérifiant un peu plus d'un million d'entre elles que ces étonnants résultats ont pu être établis.

Internet disparaît peu à peu, les pages Web ne sont pas éternelles

Premier chiffre marquant : 38 % des pages Internet en ligne durant l'année 2013 ont désormais disparu. On peut se dire que c'est normal dans la mesure où elles ont plus de 10 ans, mais le phénomène n'est pas spécialement lié à l'âge. Si l'on se concentre sur les pages qui existait en 2023, l'étude dévoile que 8 % sont inaccessibles.

Cet amas de liens “morts” est d'autant plus problématique qu'il touche des sites où les références sont importantes. Ainsi, 23 % des pages de sites d'actualités en contiennent au moins un. Sur Wikipédia, c'est pire puisque 54 % des pages de l'encyclopédie en ligne comportent au minimum un lien qui ne renvoie à rien.

Les réseaux sociaux ne sont pas en reste avec 1 tweet sur 5 qui disparaît de la plateforme dans les mois suivant sa publication. Au total, les chercheurs estiment que 25 % de toutes les pages Web d'entre 2013 et 2023 ont été effacées. Parmi elles, 16 % étaient sur un site encore fonctionnel aujourd'hui, contre 9 % sur un site disparu entièrement. Face à cette hécatombe, la solution est peut-être de ne jamais fermer les onglets de son navigateur, quitte à basculer dans l'excès.