Google révèle la taille de son code source et d’autres données vertigineuses

Maj. le 22 février 2017 à 2 h 35 min

Généralement, lorsque nous parlons de Google, nous nous représentons le logo de la firme, nous imaginons peut-être tout un tas de ramifications et nous pensons gros, très gros chiffres. Google, c’est avant tout du codage…mais aussi encore et toujours des gros chiffres, la preuve.

Google

Nous savons que la firme de Mountain View maintenant sous l’égide de l’entité appelée Alphabet, est gigantesque au niveau de sa portée mondiale, de son influence mais aussi au niveau de son infrastructure. À ce niveau, tout commence par le code source. Une fois à ses pieds, quelle taille fait le géant ?

Rachel Potvin, directrice de l’ingénierie pour Google a pu apporter une réponse à cette question. L’espace de programmation de Google (incluant le code source, les lignes de code et les modifications quotidiennes) représenterait environ 2 milliards de lignes, soit quarante fois celui du système d’exploitation Microsoft Windows, composé de 50 millions de lignes. Son code informatique pèse 86 TeraOctets.

Google repository statistiques

A titre indicatif, Windows est réputé pour être l’un des logiciels les plus complexes jamais développés pour un ordinateur grand public et en développement constant depuis trente ans. En résumé, construire Google équivaut à gérer 40 Windows en même temps car les 2 milliards de lignes se trouvent en un seul et même fichier.

Google manipulation code

Un unique colossal fichier pour gérer Google Search, Drive, Maps, Google+, Gmail, YouTube et tous les autres services de l’entreprise. Un seul « repository » accessible aux 25000 ingénieurs épluchant pas moins de 9 millions de fichiers sources et un milliard de fichiers de tout autre type. 45 000 modifications sont réalisées quotidiennement dont 15000 à la main et le reste automatiquement. Depuis la création de Google, 35 millions de corrections ont été effectuées.

Google modifications code

Un contrôleur pour 2 milliards de lignes

Ces lignes ont poussé Google au développement de son propre logiciel de contrôle de version afin de pouvoir toujours garder un œil sur le code. Baptisé Piper, le système est à l’affût du moindre problème et scrute en permanence dix data centers différents afin d’assurer le bon fonctionnement des services en ligne utilisés à chaque minute de la journée à travers le monde.

Rachel Potvin explique que tout a été plus ou moins déjà développé et se situe répertorié au sein de bibliothèques de codes. Les 25000 ingénieurs au service du code de Google ont bien évidemment accès à ces bases de données. Une simple modification pourra être déployée à tous les services par simple publication du changement du code.

Google workflow code

Seul le Google PageRank semble être traité à part par une poignée d’ingénieurs triés sur le volet. L’algorithme de recherche développé par la firme est la potion magique de Google, voilà pourquoi seuls quelques intimes ont le droit de manipuler la recette miracle. Aussi, Android et Chrome font bande à part et ne sont donc pas géré par le même système de gestion des versions.

Une version Open Source de Piper serait en cours de développement sur un projet commun à Google et Facebook. Si ce dernier paraît minuscule avec ses 20 millions de lignes, il reste très imposant et en évolution permanente. L’élaboration de ce système de gestion des versions sera accessible à tous et se baserait sur l’actuel Mercurial. Ils veulent voir s’il serait capable de gérer un fichier de la taille du code source de Google. Car l’avenir se dessine désormais à base de ces lignes de codes et qu’il faudra une solution pour tout surveiller.

Voici en résumé l’intervention de Rachel Potvin :

via

Réagissez à cet article !
  • Vertigineux ?

  • djibi400

    « Baptisé Piper, le système est à l’affût du moindre problème »

    « Pied Piper » plutôt ! Hahaha
    Ceux qui connaissent comprendrons :’)

    • Jimmy Prost

      Et tu crois que google le réussi le test de weissman?:)

      • djibi400

        Ils sont sûrement les mieux placés pour le réussir !

  • Jejey

    Just… wow 0_o

    Google est bien le géant d’aujourd’hui. Ou devrais-je dire  » Alphabet  » ?

    • Arka

      Justement ça c’est toute la partie Google, que la partie Google, la partie alphabet est ailleurs

  • Zulius

    Vous êtes SÛR que tout est sur UN seul et UNIQUE fichier ?????

    Moi je comprend qu’il y a 2 milliards de lignes de code sur un total de 1 milliards de fichiers et 9 millions de fichiers de code source qui représente en totalité 86to….

    • +1, j’allais faire le même commentaire.

    • ONANGA Alexandre

      J’ai eu la meme réaction que toi. Je suis un « beginner in programming » et pourtant je sais qu’un projet ne peut pas tenir sur un seul fichier source.

      • Paul

        Heureusement d’ailleurs ! imagine un jeux coder sur une seule classe ^^

        • Teddy

          Je n’imagine même pas qu’elle machine faudra t’il posséder pour compiler, et quelle autre machine faudrait pour lancer ce programme en un temps correcte. Je n’imagine même pas quel type de disque faudra t’il posséder pour stocker un fichier aussi volumineux que 86to :/

          • Paul

            surtout s’ils doivent recompiler à chaque maj ahah

          • Florian Dubois

            Tu croit que Google a un ordi a 2Giga de ram est 5MO de connexion ? je pense que c’est possible mais 86TO en 1SEUL FICHIER c’est trop mais sur un dossier possible

          • Arka

            15 HDD de 6 Go en RAID0… Mais je pense personnellement qu’il ont plus de disque et plus petits pour augmenter la vitesse

  • teklib

    deux lignes de codes par fichier en moyenne ???c’est tout?
    c’est pas très significatif, tu peux écrire tout un programme sur une ligne comme faire plein de lignes avec une « phrase » de code …

    • Non, 222. Il y a 9 millions de fichiers source, pour 1 milliard de fichiers au total (les fichiers d’images, etc).

  • Teddy

    « les 2 milliards de lignes se trouvent en un seul et même fichier » ça je n’y crois vraiment pas, et je n’y croirais jamais à part si j’ai ce fameux fichier sous les yeux !
    Vous avez peut être voulu dire en un seul et même serveur ? Un seul et même parc de serveur ? Un seul et même dossier ? un seul et même disque dur ? Enfin, je ne sais pas trop quel est le vrai terme, mais un seul et même fichier (.ZIP ?) je n’y crois vraiment pas, de plus ça n’aurait aucun sens, étant donné qu’il est plus sain et plus simple de programmer plusieurs fichiers tout comme Windows (ou n’importe qu’elle autre logiciel)

  • Hollow

    Mais non, il ne s’agit pas d’un seul fichier. Les 2 milliards de lignes de codes sont répartis sur 9 millions de fichiers. Il suffit de lire le graphique…

  • DJSKY

    Vous parlez, met je rappelle que Google détent le fameux ordinateur  » D-Wave Systems, et si il nous manipulais ? et si il étais a l’ordinateur quantique ? 86TO c’est rien pour un calculateur quantique, et 2 milliards de ligne de codes il te les fait en 10 a 15 seconde… Je sais pas met j’ai comme l’impression que se méga Park de serveur est pas plus puissant que un seul ordinateur quantique…
    Puis nous on a des disque dur  » grand publique  » eux a mon avis leur disque dur dépasse le les 10TB, Samsung a fait un SSD de 15TB et Western Digital de 65TB si je me souviens bien… donc bon, je pense que on es plus manipulé que autre chose, nos Intel core i7 et j’en passe, et nos processeur, RAM tout notre matos grand publique, il es démodé..
    C’est un peut comme avoir un nouvelle appareille photos qui coûté hors de prix de 2015 et avoir un appareille photos reflex de 2005, le reflex ferra mille fois mieux… quelque en sois le prix, a vous d’en juger, on nous cache beaucoup de chose sur l’évolution nano technologique et j’en passe…

Abonnez-vous gratuitement à la newsletter
Chaque semaine, le meilleur de Phonandroid dans votre boite mail !
Demandez nos derniers articles !
Droits Ligue 1 : Facebook et Amazon pourraient diffuser les matchs

Et si les futurs OM-PSG étaient diffusés sur Amazon Prime Video ou Facebook ? Les deux géants américains se sont montrés intéressés par les droits de diffusion de la Ligue 1 auprès de la LFP. Formuleront-ils une proposition lors de l’appel d’offres ?