Voici l’astuce d’Apple pour que ses présentateurs disent « Hey Siri » sans réveiller des millions d’iPhone
À chaque keynote Apple, les présentateurs prononcent « Hey Siri » des dizaines de fois. Pourtant, aucun iPhone ne réagit dans la salle ni chez les spectateurs. Un ingénieur a percé ce mystère grâce à une simple analyse audio.

Les assistants vocaux écoutent en permanence le mot qui les réveille. Cette vigilance constante crée un problème bien connu, le déclenchement accidentel. Une voix à la télévision ou une conversation suffit parfois à activer un appareil sans raison. La firme à la pomme a longtemps soigné son interface autour de son assistant, comme le montrait l'interface de l'iPhone avec iOS 27 et une Siri enfin au niveau, présentée plus tôt cette année. Apple a aussi résolu un casse-tête bien plus discret.
Lors de ses conférences, la marque à la pomme diffuse des vidéos où ses présentateurs disent « Hey Siri » à de nombreuses reprises. Aucun iPhone du public ne s'active pourtant. Le phénomène a sauté aux yeux durant la WWDC 2026, la keynote qui a dévoilé la nouvelle version d'Apple Intelligence pour iOS 27. La firme de Cupertino n'a jamais expliqué comment elle évitait ces réveils en chaîne. Un ingénieur du son a décidé de creuser la question, animé par la curiosité.
Apple retire une plage de fréquences précise pour endormir Siri pendant ses keynotes
Le compte Techexplain a publié son analyse sur Substack. Son auteur a récupéré l'audio et la vidéo de la keynote, puis les a passés dans un analyseur de spectrogramme. Ce logiciel transforme le son en graphiques colorés qui montrent chaque fréquence. La vidéo a vite livré son secret. Apple avait retiré plusieurs bandes situées entre 3 kHz et 6 kHz. Sans elles, Siri niché dans chaque appareil n'entend plus son nom, même répété à l'écran face à des millions de spectateurs.
Cette plage de fréquences n'a rien d'anodin. L'iPhone embarque une puce toujours active, chargée d'échantillonner le son ambiant en continu. Elle convertit ce flux en spectrogramme, puis le confie à un réseau neuronal. Ce dernier ne cherche pas des mots mais un motif sonore précis, le sifflement produit quand on prononce « Siri ». Or ce son se loge justement entre 3 kHz et 6 kHz. En supprimant cette tranche, Apple permet à ses orateurs de parler naturellement sans déclencher tous les appareils alentour.