Comment briser le chiffre Playfair : un guide complet de la cryptanalyse
Apprenez à déchiffrer un chiffre Playfair à l'aide de l'analyse de fréquence, d'attaques en texte clair connu, d'attaques par dictionnaire et d'escalade avec recuit simulé. Guide complet de cryptanalyse avec des exemples concrets.
Comment briser le chiffre Playfair : un guide complet de cryptanalyse
Le chiffre Playfair a été le premier chiffre de substitution digraphique à être largement utilisé à des fins militaires, protégeant les communications britanniques de la guerre des Boers tout au long des deux guerres mondiales. Bien qu’il soit bien plus sécurisé que les simples chiffrements de substitution, il n’est pas incassable. Ce guide couvre toutes les principales méthodes permettant de déchiffrer les chiffres Playfair, de l'analyse de fréquence classique aux techniques informatiques modernes.
Que vous disposiez d'un texte chiffré Playfair avec une clé connue, une clé suspectée ou aucune clé du tout, ce guide vous guidera étape par étape tout au long du processus de cryptanalyse. Pour un décryptage pratique, utilisez notre décodeur de chiffre Playfair gratuit.
Comprendre les faiblesses de Playfair
Avant de tenter de déchiffrer le chiffre Playfair, il est essentiel de comprendre pourquoi il peut être déchiffré. Le chiffre possède plusieurs propriétés structurelles exploitées par les cryptanalystes.
Préservation de la fréquence du digraphe
Le chiffre Playfair crypte les paires de lettres (digraphes), et chaque digraphe de texte en clair correspond toujours au même digraphe de texte chiffré sous une clé donnée. Cela signifie que la distribution statistique des fréquences des digraphes anglais est préservée dans le texte chiffré – simplement décalée vers différentes paires de lettres.
En anglais, les digraphes les plus courants sont :
| Rang | Digraphe | Fréquence |
|---|---|---|
| 1 | TH | 3,56% |
| 2 | HE | 3,07% |
| 3 | IN | 2,43% |
| 4 | ER | 2,05% |
| 5 | AN | 1,99% |
| 6 | RE | 1,85% |
| 7 | ON | 1,76% |
| 8 | AT | 1,49% |
| 9 | EN | 1,45% |
| 10 | ND | 1,35% |
Avec suffisamment de texte chiffré (généralement plus de 200 caractères), ces modèles deviennent statistiquement identifiables.
La propriété réciproque
Le chiffre Playfair a une propriété structurelle cruciale : si le digraphe en texte clair AB chiffre en texte chiffré CD, alors le texte en clair BA chiffre en DC. Cette relation « réciproque » s'applique aux trois règles de chiffrement (même ligne, même colonne et rectangle).
Cette propriété signifie que si vous observez une paire de digraphes de texte chiffré comme XY et son inverse YX apparaissant avec des fréquences corrélées, vous pouvez en déduire que le texte brut sous-jacent contient une paire de digraphes réversibles commune (comme TH et HT, ou ER et RE).
Modèles digraphiques répétés
Les digraphes de texte en clair identiques produisent toujours des digraphes de texte chiffré identiques. Cela signifie que des mots ou des phrases répétés dans le texte brut créent des répétitions reconnaissables dans le texte chiffré. Les modèles anglais courants tels que « THE THE » ou les terminaisons de mots telles que « -TION » produisent des signatures détectables.
De plus, le chiffre Playfair insère des caractères de remplissage (généralement X) pour briser les paires de lettres identiques. Si vous voyez de nombreux digraphes contenant X dans un décryptage suspecté, cela confirme le mécanisme Playfair et aide à identifier les positions de remplissage.
Alphabet limité (25 lettres)
Le chiffre Playfair fonctionne sur un alphabet de 25 lettres (I et J partagent une position), ce qui signifie :
- La matrice clé est toujours une grille 5x5
- Il n'y en a que 25 ! / 2 matrices de clés fonctionnellement distinctes (environ 7,9 x 10 ^ 24)
- Bien que cela semble énorme, il est bien inférieur au maximum théorique d'un chiffre digraphique, et les méthodes de recherche structurées peuvent y naviguer efficacement.
Méthode 1 : attaque par analyse de fréquence
L'analyse de fréquence est l'approche la plus ancienne et la plus intuitive pour déchiffrer les chiffres Playfair. Bien que l'analyse de fréquence d'une seule lettre (l'outil standard contre les chiffres César et les chiffres par mot-clé) ne fonctionne pas, l'analyse de fréquence digraphique peut être très efficace.
Construire une table de fréquence de digraphe anglais
Pour effectuer une analyse de fréquence, vous avez besoin d’un tableau de référence des fréquences digraphiques anglaises. Ce tableau est construit en comptant toutes les paires de lettres consécutives dans un grand corpus de texte anglais. Les 20 premiers digraphes représentent environ 30 % de toutes les paires de lettres de la prose anglaise typique.
Correspondance des digraphes de texte chiffré
Le processus fonctionne comme suit :
-
Comptez tous les digraphes dans le texte chiffré. Avec N caractères, vous avez N/2 digraphes (le texte chiffré Playfair a toujours une longueur paire).
-
Classez les digraphes de texte chiffré par fréquence, du plus courant au moins.
-
Mappez provisoirement les digraphes de texte chiffré les plus courants avec les digraphes anglais les plus courants (TH, HE, IN, ER, AN, etc.).
-
Vérifiez la cohérence : si le digraphe de texte chiffré XY correspond au texte en clair TH, le YX inversé correspond-il à HT à une fréquence plausible ?
-
Tentez un décryptage partiel avec les mappages provisoires et recherchez des mots anglais reconnaissables dans le résultat.
-
Affinez le mappage en ajustant les affectations qui produisent un texte peu plausible.
Exemple concret
Supposons que vous disposiez du texte chiffré (plus de 300 caractères) et que votre décompte de fréquence indique :
Most common ciphertext digraphs: QK (15), BP (12), KQ (10), DM (9), ...
Puisque TH est le digraphe anglais le plus courant :
- Attribuer provisoirement QK -> TH
- Vérifiez si KQ (l'inverse) apparaît à une fréquence cohérente avec HT
- KQ apparaît 10 fois -- HT est en effet un digraphe inversé courant, cette affectation est donc plausible
Continuez ce processus pour les prochains digraphes les plus courants. Après avoir établi 5 à 8 mappages, vous disposerez probablement de suffisamment de contraintes de position des lettres pour commencer à déduire la matrice clé.
Limitation : L'analyse de fréquence nécessite à elle seule un texte chiffré substantiel (plus de 300 caractères) et fonctionne mieux avec la prose anglaise naturelle. Les messages courts ou les messages avec un vocabulaire inhabituel peuvent ne pas présenter de modèles statistiques suffisants.
Méthode 2 : Attaque en texte clair connu (basée sur Crib)
Une attaque en clair connue est le moyen le plus rapide de déchiffrer un chiffre Playfair, à condition que vous puissiez deviner une partie du contenu du message d'origine.
Qu'est-ce qu'un berceau ?
Un « berceau » est un mot ou une expression qui, selon vous (ou savez), apparaît dans le texte brut. Les berceaux proviennent de :
- Formats de message standard : les messages militaires commencent souvent par des expressions courantes telles que "ATTENTION" ou "REPORT".
- Connaissance contextuelle : si vous connaissez le sujet, une certaine terminologie est probable (par exemple, "ATTACK", "POSITION", "SUPPLY")
- Phrases anglaises courantes : "THE", "AND", "THAT" apparaissent dans presque tous les messages
- Signatures ou adresses : les messages se terminent souvent par le nom de l'expéditeur ou par une fermeture standard
Déduire les positions clés de la matrice
Une fois que vous avez un berceau et sa position de texte chiffré correspondante, chaque paire de digraphes texte brut-texte chiffré révèle des informations structurelles sur la matrice clé :
-
Paire de même ligne : si texte en clair AB -> texte chiffré CD où A et C sont dans la même ligne et B et D sont dans la même ligne, vous savez que ces quatre lettres partagent deux lignes dans la matrice.
-
Paire de même colonne : révèle de la même manière les relations entre les colonnes.
-
Paire de rectangles : révèle que A et C partagent une ligne, et B et D partagent une ligne, tandis que A et B sont dans des lignes et des colonnes différentes.
Chaque paire confirmée contraint davantage la matrice. Avec 6 à 8 paires de digraphes confirmées, vous pouvez souvent reconstruire l'intégralité de la matrice 5x5.
Exemple concret
Supposons que vous interceptiez un texte chiffré Playfair et soupçonniez que le texte en clair commence par « ATTACK AT DAWN » :
Digraphes en texte brut : AT TA CK AT DA WN
Digraphes de texte chiffré (au début) : BW WB HK BW NE XO
Observations :
- AT -> BW et TA -> WB (propriété réciproque confirmée)
- AT apparaît deux fois et correspond à BW les deux fois (cohérence confirmée)
- Puisque A->B et T->W pour la règle du rectangle, A et B partagent une ligne, T et W partagent une ligne, et ils forment un rectangle dans la matrice
À partir de ces relations, vous pouvez commencer à placer A, B, T, W dans la matrice. Continuez avec CK -> HK (C et H partagent une ligne ou une colonne avec K) et construisez progressivement la matrice complète.
Méthode 3 : Dictionnaire / Attaque par force brute
Pourquoi la Full Brute Force n'est pas pratique (25 !)
La matrice de clés Playfair est une permutation de 25 lettres dans une grille 5x5. Le nombre d'arrangements distincts est de 25 ! / 2 (tenant compte du fait qu'une matrice et son équivalent produisent le même chiffre). Cela représente environ 7,9 x 10^24 – bien trop pour être testé de manière exhaustive, même avec des ordinateurs modernes.
Avec un milliard de tests par seconde, une recherche complète par force brute prendrait environ 250 millions d’années.
Recherche de clé basée sur un dictionnaire
Une alternative pratique consiste à tester les mots du dictionnaire comme mots-clés :
- Créez un dictionnaire de mots clés : collectez des mots, des noms et des expressions anglais courants (10 000 à 100 000 entrées)
- Pour chaque mot-clé : générez la matrice 5x5, déchiffrez le texte chiffré et notez le résultat
- Fonction de notation : mesurez à quel point le texte déchiffré ressemble à l'anglais en utilisant :
- Score de probabilité log-quadgramme (séquence de quatre lettres)
- Détection de mots courants (THE, AND, FOR, etc.)
- Comparaison de la distribution de fréquence des lettres
- Classez les résultats par score et examinez les meilleurs candidats
Les attaques par dictionnaire fonctionnent bien lorsque la clé est un seul mot anglais, ce qui était une pratique courante dans l'utilisation militaire et personnelle du chiffre Playfair. Pour des clés plus complexes, utilisez la méthode d'escalade décrite ci-dessous.
Méthode 4 : Escalade avec recuit simulé
L'escalade avec recuit simulé est la méthode générale la plus puissante pour briser les chiffres Playfair. Il fonctionne sans aucune connaissance préalable de la clé et peut déchiffrer la plupart des chiffrements de plus de 200 caractères.
Conception des fonctions de remise en forme (score Quadgram)
La fonction fitness évalue dans quelle mesure un décryptage candidat ressemble au texte anglais. L'approche la plus efficace utilise les probabilités logarithmiques du quadgramme :
- Construire une table de fréquences de quadgrammes à partir d'un grand corpus anglais (plusieurs millions de caractères)
- Pour chaque séquence de quatre lettres dans le décryptage candidat, recherchez sa log-probabilité
- Sommez toutes les probabilités du journal pour obtenir le score total de condition physique
- Des scores plus élevés indiquent un texte qui ressemble plus à l'anglais
Par exemple, le quadgramme "THER" a une probabilité logarithmique élevée (il apparaît fréquemment en anglais), tandis que "QXZK" en a une très faible. Un message correctement déchiffré aura un score total bien plus élevé qu’un arrangement aléatoire.
La formule standard de notation de la condition physique est la suivante :
fitness = sum(log10(count(quadgram_i) / total_quadgrams)) for all quadgrams in text
Recuit simulé pour échapper aux optimums locaux
L'escalade pure (qui accepte toujours les améliorations) reste souvent bloquée dans les optima locaux - des matrices clés qui obtiennent de bons résultats mais ne constituent pas la véritable solution. Le recuit simulé résout ceci :
- Initialiser avec une matrice de touches aléatoire de 25 lettres
- Réglez la température initiale T sur une valeur élevée (par exemple, T = 10)
- Boucle principale (généralement 50 000 à 100 000 itérations) : une. Apportez une petite modification aléatoire à la clé actuelle (échangez deux lettres, échangez deux lignes, échangez deux colonnes, inversez une ligne ou inversez une colonne) b. Décryptez le texte chiffré avec la nouvelle clé et calculez le score de condition physique c. Si le nouveau score est meilleur, acceptez le changement d. Si le nouveau score est pire, acceptez avec probabilité exp((new_score - old_score) / T) e. Réduisez progressivement T (programme de refroidissement, par exemple, T = T * 0,999)
- Enregistrez la meilleure clé trouvée dans toutes les itérations
- Redémarrez plusieurs fois avec différentes clés initiales aléatoires pour améliorer la fiabilité
Les modifications clés de l'étape 3a devraient être de petites perturbations qui explorent les matrices clés proches :
- Échanger deux lettres aléatoires : l'opération la plus courante
- Échanger deux lignesouéchanger deux colonnes : changements structurels plus importants
- Inverser une ligneouinverser une colonne : modifications à moyenne échelle
Une implémentation typique exécute 20 à 30 redémarrages, chacun avec 50 000 itérations, et trouve de manière fiable la clé correcte pour les textes chiffrés de plus de 200 caractères. Les textes chiffrés plus courts (100 à 200 caractères) peuvent nécessiter davantage de redémarrages.
Tutoriel pratique : Briser un Playfair étape par étape
Passons en revue un exemple complet de déchiffrement d'un chiffre Playfair en utilisant l'approche d'escalade.
Étape 1 : Confirmez qu'il s'agit d'un chiffre Playfair
Avant de tenter une analyse cryptée, vérifiez que le texte chiffré a bien été chiffré avec le chiffre Playfair. Recherchez ces indicateurs :
- Nombre pair de caractères : le texte chiffré Playfair a toujours une longueur paire car il traite les digraphes. Si le nombre de personnages est impair, ce n'est pas Playfair.
- Vérification de l'alphabet : Standard Playfair utilise seulement 25 lettres (I et J sont fusionnés). Si J apparaît dans le texte chiffré, le chiffre peut utiliser une variante non standard ou peut ne pas être du tout Playfair.
- Modèles digraphiques répétés : recherchez des digraphes qui se répètent à intervalles réguliers. En anglais standard crypté avec Playfair, vous devriez voir des digrammes apparaître 3 à 5 fois dans un message de 200 caractères.
- Pas de modèles à une seule lettre : contrairement aux chiffrements monoalphabétiques, Playfair ne préserve pas les distributions de fréquences à une seule lettre. Si une analyse de fréquence standard correspond étroitement à l’anglais, le chiffre n’est probablement pas Playfair.
Étape 2 : Analyse initiale
Avant d'exécuter l'algorithme d'escalade, rassemblez des informations sur le texte chiffré :
- Comptez tous les digraphes et classez-les par fréquence. Les 5 à 10 digraphes les plus courants sont vos principales cibles d’analyse.
- Recherchez la propriété réciproque : vérifiez si des digraphes inversés apparaissent avec des fréquences corrélées (par exemple, si XY apparaît 8 fois, YX apparaît-il également fréquemment ?).
- Estimer la longueur du message : les messages plus longs (plus de 300) caractères donnent à l'algorithme plus de données statistiques avec lesquelles travailler, ce qui entraîne un craquage plus rapide et plus fiable.
Étape 3 : Course d'escalade avec recuit simulé
Configurez l'algorithme avec ces paramètres :
- Température initiale : T = 10 (ou plus pour les textes chiffrés très courts)
- Taux de refroidissement : multipliez T par 0,999 à chaque itération
- Itérations par redémarrage : 50 000 pour les textes chiffrés de plus de 200 caractères ; augmenter à 100 000 pour les textes plus courts
- Nombre de redémarrages : 20 à 30 redémarrages avec différentes clés initiales aléatoires
- Fonction Fitness : notation de probabilité du quadgramme anglais
Lors de chaque redémarrage, l'algorithme convergera vers une clé avec un score élevé. Suivez la meilleure clé trouvée lors de tous les redémarrages.
Étape 4 : Évaluer et vérifier le résultat
Une fois l’algorithme terminé, évaluez le décryptage le mieux noté :
- Lisez le texte : est-ce que cela a du sens en tant que prose anglaise ? Recherchez des mots et des phrases reconnaissables.
- Vérifiez le score de condition physique : comparez-le au score attendu pour un texte anglais de cette longueur. Un message correctement déchiffré devrait obtenir un score nettement supérieur à celui d’un texte aléatoire.
- Vérifiez en rechiffrant : utilisez la matrice de clés découverte pour rechiffrer le texte brut avec notre calculatrice de chiffrement Playfair. S’il produit le texte chiffré original, la fissure est confirmée.
- Extraire le mot-clé : examinez la matrice de clés pour trouver un mot-clé reconnaissable. Les premières lettres de la matrice indiquent souvent le mot-clé original utilisé pour le cryptage.
Essayez-le vous-même
Prêt à décrypter un chiffre Playfair ? Utilisez nos outils en ligne gratuits :
- Décodeur du chiffre Playfair -- déchiffre instantanément avec un mot-clé connu
- Calculateur du chiffre Playfair -- crypte les messages pour créer des textes chiffrés pratiques
- Exemples Playfair -- exemples pratiques étape par étape pour l'apprentissage
Pour d'autres types de chiffrement, explorez notre Chiffre à quatre carrés (une variante avancée de Playfair), Chiffre de Vigenere (substitution polyalphabétique) ou Chiffre de Hill (cryptage polygraphique matriciel).
FAQ
Quelle doit être la longueur du texte chiffré pour déchiffrer un chiffre Playfair ?
Pour l'escalade avec recuit simulé, environ 200 caractères (100 digraphes) constituent le minimum pour des résultats fiables. Avec plus de 300 caractères, les taux de réussite approchent les 100 %. L'analyse de fréquence à elle seule nécessite généralement plus de 400 caractères. Les attaques en texte clair connu peuvent fonctionner avec des textes chiffrés beaucoup plus courts si le crib est précis.
Les ordinateurs modernes peuvent-ils briser instantanément les codes Playfair ?
Oui, pour les textes chiffrés typiques. L'escalade avec recuit simulé peut déchiffrer un chiffre Playfair de 200 caractères en moins de 10 secondes sur un ordinateur portable moderne. Le facteur clé n’est pas la puissance brute de calcul mais la qualité de la fonction fitness et le nombre de redémarrages.
Le chiffre Playfair est-il encore utilisé aujourd'hui ?
Non, le chiffre Playfair n’est pas utilisé aujourd’hui pour de véritables applications de sécurité. Il a été officiellement retiré de l'usage militaire après la Guerre mondiale II. Cependant, il reste largement enseigné dans les cours de cryptographie et est populaire dans les concours de réflexion, les escape games et les contextes éducatifs.
Quelle est la différence entre casser Playfair et casser un chiffre César ?
Un chiffre César n'a que 25 clés possibles, donc la force brute fonctionne de manière triviale. Le chiffre Playfair a environ 7,9 x 10 ^ 24 clés possibles, nécessitant des méthodes de recherche intelligentes comme l'escalade. De plus, les chiffres César sont décryptés avec une analyse de fréquence à une seule lettre, tandis que Playfair nécessite une analyse au niveau du digraphe.
Pourquoi le chiffre Playfair était-il considéré comme sécurisé à son époque ?
Lorsqu’il a été introduit en 1854, le chiffre Playfair était révolutionnaire car il résistait à la seule méthode d’attaque connue : l’analyse fréquentielle d’une seule lettre. L'énorme espace de touches (25 !) rendait la force brute impossible sans ordinateurs. Ce n’est qu’au début du XXe siècle que les cryptanalystes ont développé des techniques efficaces contre les chiffrements digraphiques, et ce n’est qu’à l’ère informatique que le craquage automatisé est devenu pratique.
Puis-je déchiffrer un chiffre Playfair à la main ?
Oui, mais cela demande de la patience et du savoir-faire. Les attaques en texte clair peuvent être effectuées à la main si vous disposez d'un bon berceau. L'analyse de fréquence est possible manuellement pour les textes chiffrés plus longs, mais elle est fastidieuse. L'escalade et le recuit simulé nécessitent essentiellement un ordinateur. L'outil de décodeur Playfair automatise le processus.
Comment le chiffre Playfair se compare-t-il au chiffre Vigenere en termes de sécurité ?
Le chiffre Vigenere utilise la substitution polyalphabétique (la même lettre de texte en clair peut correspondre à différentes lettres de texte chiffré en fonction de la position), tandis que le chiffre Playfair utilise la substitution digraphique. Pour les clés courtes, Playfair est généralement plus sécurisé car son traitement digraphique permet une meilleure diffusion. Cependant, le chiffre de Vigenère avec une clé longue peut être plus résistant à l'analyse. Tous deux sont considérés comme peu sûrs selon les normes modernes et sont rompus avec des techniques différentes : examen Kasiski pour Vigenere, escalade pour Playfair.
Quels outils et logiciels peuvent déchiffrer les chiffres Playfair ?
Plusieurs outils peuvent déchiffrer automatiquement les chiffres Playfair. Notre décodeur de chiffrement Playfair en ligne gratuit gère le décryptage avec des clés connues. Pour casser des clés inconnues, CrypTool (une suite de cryptanalyse open source), des scripts Python personnalisés utilisant la notation quadgramme et diverses plates-formes de cryptanalyse en ligne prennent en charge le craquage Playfair. La condition essentielle pour tout outil est une bonne fonction de fitness (score de quadgramme) et une longueur de texte chiffré suffisante (plus de 200 caractères).