培根密码历史:Francis Bacon、隐写术与莎士比亚之争
探索 Francis Bacon 密码从 1605 年发明,到莎士比亚著作权争议,再到现代隐写术的完整历史。了解培根的双字母字母表如何开创了二进制编码的先河。
引言:一种专为隐藏自身而生的密码
大多数密码的设计目标是打乱消息内容,使截获者无法读取。培根密码的目标与此不同,也更具雄心:隐藏消息本身的存在。
这一区别——密码学与隐写术之别——是 Francis Bacon 这项发明中一切有趣之处的核心。密码学保护消息的内容,隐写术保护消息的存在。当你加密一封信时,观察者知道有秘密被隐藏,只是无法读取。而当你运用培根密码的隐写术时,观察者看到的只是普通文本,没有任何理由继续追查。
Francis Bacon 于 1605 年描述了这一系统,他借助印刷工艺中的技巧——字体 A 与字体 B 之间细微的视觉差异——将任意文本隐藏在无害的文件之中。在此后的四个世纪里,他的发明触及了莎士比亚著作权争议,塑造了美国两位最伟大的密码分析学家的职业生涯,并在数字隐写术、密室逃脱谜题和竞技密码学中找到了新的生命。
本文将完整追溯这段历史。
试用我们的培根密码解码器,亲自体验这一密码。
Francis Bacon:哲学家、政治家、密码学家
Francis Bacon 于 1561 年 1 月 22 日出生于伦敦,是伊丽莎白一世时期掌玺大臣 Nicholas Bacon 爵士的次子。他十二岁入读剑桥大学三一学院,后在格雷律师学院研习法律。三十多岁时,他已是一名执业律师和议会议员;四十多岁时,他成为王室最具影响力的顾问之一。
在詹姆斯一世统治时期,Bacon 升至英格兰最高法律职位。他于 1607 年出任副检察长,1613 年出任检察长,同年又出任普通诉讼法院首席法官,1618 年出任大法官,同年受封维鲁拉姆男爵,后又晋封圣奥尔本斯子爵。1621 年,他以受贿罪被定罪,被禁止担任公职,政治生涯戛然而止,但他的思想遗产早已奠定。
Bacon 最主要的历史形象是阐明了归纳科学方法的哲学家——他认为知识必须建立在细致观察和系统实验之上,而非从第一性原理出发纯粹依靠演绎推理。他的《新工具》(1620 年)和《学术的进展》(1605 年)为十七世纪随之而来的科学革命奠定了基础。
鲜为人知的是,Bacon 终其一生都对秘密通信的机制抱有浓厚兴趣。他深知信息本身可以成为权力的工具,并对如何秘密传递信息的问题着迷不已。培根密码就是他对这一问题的实践回答——并非纯粹的理论好奇,而是他认为可以切实使用的工作系统。
双字母字母表:Bacon 1605 年的发明
Bacon 最早在 1605 年出版的《学术的进展》中描述了他的密码系统。1623 年,他在扩充的拉丁文版本《De Augmentis Scientiarum》中进一步阐发。他称之为"双字母密码"(Biliteral Cipher)——源自拉丁语 bi(二)和 littera(字母)——因为整个系统依赖于恰好两种不同符号的使用。
其原理十分简洁。Bacon 观察到,若有五个二进制位,每位可取两个值之一,则可产生 2 × 2 × 2 × 2 × 2 = 32 种不同组合。他所处时代的英文字母表有 24 个字母(I 与 J 视为同一字母,U 与 V 亦同,沿袭拉丁语惯例)。三十二种组合足以编码全部 24 个字母,还余下八个。
Bacon 为每个字母指定了一个唯一的五字符 A/B 序列:
- A = AAAAA
- B = AAAAB
- C = AAABA
- D = AAABB
- E = AABAA
……以此类推,贯穿整个字母表。这些序列遵循严格的二进制计数顺序,因此系统完全规则,无需死记硬背,只需掌握基本原理即可。
编码一条消息时,先将每个字母转换为其五字符编码,生成一长串 A 和 B。这串密文——就是密文——可以通过两种方式传递。可以直接发送,但这显然是被编码过的。或者,可以通过使用两种在视觉上相似但可区分的形式来分别代表 A 和 B,将其隐藏在一段普通文本中。
第二种方式正是 Bacon 着重强调的隐写用途。他提议使用两种字体——字体 A 和字体 B——对普通读者而言几乎一模一样,但仔细辨别可以区分。知晓秘密的排版工可以按照培根密码模式,用这两种字体排印任何无害的文本,最终文件看起来完全正常,同时在字体变化中携带隐藏消息。
这正是培根密码同时属于隐写术史和密码学史的原因。编码方法属于密码学;隐藏方法属于隐写术。在 Bacon 看来,这种组合使其对任何不事先怀疑的人而言几乎无法察觉。
培根密码隐写术的工作原理
要理解培根密码系统的实际威力,不妨通过一个具体示例来加以说明。
假设秘密消息是单词 BACON 本身。
首先,使用 24 字母培根字母表对每个字母进行编码:
- B = AAAAB
- A = AAAAA
- C = AAABA
- O = ABBAB
- N = ABBAA
完整密文为:AAAAB AAAAA AAABA ABBAB ABBAA
这是一个 25 字符的字符串。要隐藏它,需要一段至少 25 个字母的载体文本。假设载体文本为:"The art of secret writing is a noble and ancient study."(秘密写作的艺术是一门高贵而古老的学问。)
然后按照密文模式,用两种字体排印载体文本。载体文本的第一个字母(T)对应密文的第一个字符(A)——因此 T 用字体 A 排印。第二个字母(h)对应 A——字体 A。以此类推。载体文本的第五个字母对应 B——该字母用字体 B 排印。
看到印刷文件的读者看到的是一个完全正常的句子。而知道要查看字体模式的读者则提取 A/B 序列,每五个一组,还原出原始单词 BACON。
Bacon 明确描述了创建两种不同形式的几种方法:
- 两种字体,在衬线或笔画粗细上略有差异
- 斜体与罗马体(直立体)字形
- 较大与较小的字号
- 粗体与常规字重
在现代应用中,人们通常使用大写与小写,或用二进制表示法中的 1 与 0。无论选择何种具体符号,原理完全相同。关键在于存在两种视觉上可区分的形式,并且知晓密钥的读者能够可靠地加以区分。
探索我们的培根密码隐写工具,通过实时文本亲眼见证这一隐藏过程。
莎士比亚著作权争议
培根密码历史中吸引了最多公众关注——也引发了最多争议——的,莫过于它在莎士比亚著作权争议中所扮演的角色。
"培根理论"主张 Francis Bacon 才是署名为威廉·莎士比亚的戏剧和诗歌的真正作者。这一理论由来已久,但其最著名的密码学篇章始于 1888 年——明尼苏达州政客、业余学者 Ignatius Donnelly 出版了《大密码本:弗朗西斯·培根在所谓莎士比亚戏剧中的密码》(The Great Cryptogram: Francis Bacon's Cipher in the So-Called Shakespeare Plays)。
Donnelly 声称在莎士比亚第一对开本(1623 年)中发现了隐藏消息,证明了 Bacon 的著作权。他认为,对对开本的页码和栏号运用一套复杂的算术方法,便可提取出揭示 Bacon 身份的培根密码消息。此书在大众媒体中引发轰动,多次加印。
密码学专业界对此并不买账。专业密码分析学家指出,Donnelly 的方法根本不是真正的培根密码——Bacon 的密码依赖于字体变化,而非对页码的算术操作。更根本的是,批评者证明了 Donnelly 的方法极为灵活,几乎可以从任何足够长的文本中提取出任何消息。这正是"空想性错觉"的问题——人类倾向于在随机数据中发现有意义的模式——加上确认偏误的复合效果。如果你有动机去寻找隐藏消息,你就会找到,不管它是否真的存在。
William 和 Elizebeth Friedman 夫妇(我们将在下一节考察他们的生涯)于 1957 年发表了一项题为《莎士比亚密码考》(The Shakespearean Ciphers Examined)的严格研究。他们的结论斩钉截铁:莎士比亚文本中不存在真正的培根密码消息,而且培根理论者所使用的方法不具备科学有效性。此书被视为最终的驳斥之作。
当今学术界的主流共识是,斯特拉特福德的威廉·莎士比亚确实是署名作品的作者。著作权争议在爱好者中仍在持续,但迄今从未有可信的密码学证据支持培根理论。
讽刺的是:正是由于 Donnelly 的主张既戏剧性又错误百出,这场争议反而让培根密码在大众中广为人知。通过莎士比亚争议了解到 Francis Bacon 隐写术发明的人,远多于通过任何正当密码学来源了解到它的人。
William 与 Elizebeth Friedman:从培根密码到布莱切利
莎士比亚著作权热潮对密码学史最重大的影响,完全出乎意料。它以一种特殊的方式将两位年轻研究者引入密码系统领域,由此开启了美国最伟大密码分析学家的职业生涯。
1915 年,伊利诺伊州富有的纺织品商人 George Fabyan 以对非正统科学的古怪热情,聘请了一位名叫 William Friedman 的年轻植物学家到他位于伊利诺伊州日内瓦市郊外的私人研究庄园 Riverbank Laboratories 工作。Fabyan 对培根理论深为着迷,正在资助研究据称隐藏在莎士比亚文本中的培根密码消息。William Friedman 被安排从事这项研究。
随后加入的是 Elizebeth Smith,一位刚刚大学毕业的年轻女性,同样由 Fabyan 招募参与莎士比亚密码研究。William 与 Elizebeth 共事,于 1917 年结为夫妻,两人共同发现培根理论并不成立。但在系统调查密码主张的过程中,两人都对密码学原理形成了深刻而严谨的理解,这是当时任何正规教育都无法提供的。
1917 年美国加入第一次世界大战后,Riverbank Laboratories 成为美国少数几个能够开展严肃密码分析工作的机构之一。陆军将截获的电报送至 Riverbank 破译。William 与 Elizebeth Friedman 完成了破译工作。他们在 Riverbank 的战时工作直接引领他们走上了政府密码学职业道路,并在此后三十年间定义了美国的信号情报事业。
William Friedman 后来领导了陆军信号情报局。他最伟大的成就是在 1940 年,他的团队在从未见过实物的情况下破译了日本外交密码机 PURPLE。这一壮举使美国在整个第二次世界大战期间获取了日本的外交通信,包括对中途岛战役规划产生影响的情报。
Elizebeth Friedman 则在执法密码分析领域开拓了平行的职业生涯。禁酒令期间,她为海岸警卫队破译了私酒走私网络的密码。第二次世界大战期间,她为战略情报局和海岸警卫队工作,破译了在南美活动的轴心国间谍网络——这项工作导致大批纳粹特工被捕和起诉。
William 与 Elizebeth Friedman 夫妇都意识到一种奇特的讽刺:他们的职业生涯源于一场在莎士比亚文本中寻找培根密码消息的徒劳搜寻。他们去世后——William 于 1969 年,Elizebeth 于 1980 年——他们在阿灵顿国家公墓的墓碑铭文以最为贴切的方式向这一起源致敬。
他们在阿灵顿的合葬墓碑上,铭文之中有这样一句话:"知识就是力量"(Knowledge is Power)。而这段铭文本身以两种不同的字体排刻——那些字体用真正的培根密码编码了同一句话:KNOWLEDGE IS POWER。
这是世界上最为精妙的密码学纪念碑之一:一道隐藏在墓碑中的密码,向两位毕生致力于破译密码的人致敬,使用的正是最初将他们引入密码学的那个系统。
24 字母版与 26 字母版字母表
Bacon 1605 年的原始密码使用 24 字母字母表。这并非随意而为。在文艺复兴时期的英语中,一如古典拉丁语,I 与 J 被视为同一字母的变体形式,U 与 V 亦然。I 与 J 作为独立字母的区分,以及 U 与 V 作为独立字母的区分,在英语中直到十七世纪才逐渐成为惯例。
在 Bacon 的 24 字母系统中:
- I 与 J 共用编码 ABAAA
- U 与 V 共用编码 BAABB
解码消息时,读者依据上下文判断原意是 I 还是 J、是 U 还是 V。实际上,由于两个选项在周围文字中均清晰可辨,这种情况几乎不会造成歧义。
现代 26 字母改编版对全部 26 个字母分别加以区分:
- I = ABAAA
- J = ABAAB
- U = BABAA
- V = BABAB
其余字母的编码相应移位,以容纳两个新增的独立编码。
如果是历史研究、编码意在以文艺复兴文本读之的资料,或使用 24 字母版的文献来源,则应选用原始培根字母表。对于现代应用——尤其是科学奥林匹克竞赛 Code Busters、地理寻宝谜题、密室逃脱,以及任何 I/J 或 U/V 歧义会造成问题的情境——26 字母版是标准选择。
试用培根密码编码器,体验两种字母表版本。
培根密码在现代文化中的影响
培根密码已跨越其时代,在现代谜题文化中找到了舒适的位置。
在地理寻宝中——这是一种参与者利用 GPS 坐标寻找隐藏容器的户外活动——需要解题才能获取最终坐标的神秘宝藏(mystery cache)经常使用培根密码。其独特的 A/B 格式以及将字符每五个一组的要求,使有经验的地理寻宝爱好者一眼可辨,同时对新手仍具挑战性。地理寻宝中使用的密码类型数据库始终将培根密码列为最常见的密码之一。
密室逃脱要求参与者在限定时间内解开谜题以"逃出"主题场景,也将培根密码作为常见元素加以采用。它非常适合这种形式:一份带有不寻常大小写或字体的道具文件可以携带一条隐藏消息,玩家必须提取并解码才能继续推进。
竞技密码学同样对其青睐有加。科学奥林匹克竞赛是面向美国中学生的学术竞赛,其 Code Busters 项目考查历史密码知识。培根密码定期出现在科学奥林匹克竞赛材料中,备赛资源将其与凯撒密码、维吉尼亚密码和 Atbash 密码并列,视为标准密码类型。
在更广泛的密码学教育中,培根密码是同时引入两个重要概念的理想素材:二进制编码(每个字母恰好需要五个二进制符号)与隐写术(编码消息可以隐藏于众目睽睽之下)。古典密码中几乎没有哪一种能如此清晰简洁地同时展示这两个原理。
遗产:从二进制字母表到数字时代
关于 Francis Bacon 的密码,也许最令人惊叹的是它如何直接预示了数字计算的概念基础——不仅在精神上,更是在精确的数学结构上。
现代数字数据以二进制编码。计算机上的每一段文本、图像、音频和视频,最终都还原为 0 和 1 的序列。基本单位是比特(bit),即二进制位,只取两个值之一。
培根密码是一种五位二进制编码系统。A 是 0,B 是 1。每个字母恰好需要五个比特。编码表遵循自然的二进制计数序列:AAAAA = 00000 = 0,AAAAB = 00001 = 1,AAABA = 00010 = 2,以此类推。
这不是比喻,也不是宽泛的类比。在精确的技术意义上,培根密码就是一种五位二进制字符编码。它与现代字符编码标准的唯一区别,在于它处理的字符数量(24 或 26 个,而 ASCII 是 128 个,Unicode 是 1,114,112 个),以及它比晶体管的发明早了三个世纪这一事实。
法国工程师 Emile Baudot 于 19 世纪 70 年代发明了现称"博多码"(Baudot code)的电报编码——一种为每个字母和符号指定唯一二进制模式的五位编码,以满足电报需求。博多码成为二十世纪电传打字机所用 ITA2 标准的基础。它与 Bacon 五位系统的相似之处丝毫不差,且并非偶然:Bacon 和 Baudot 各自独立地得出了字母编码所需的最少位数是五位这一结论。
1963 年采用的美国信息交换标准码 ASCII,将这一方案扩展至七位,以容纳大小写字母、数字和标点符号。现代 Unicode 对每个字符使用最多四字节的可变长度编码,以处理世界上每一种书写系统。
Francis Bacon 于 1605 年以印刷字体为工具,发明了这一切的概念蓝图。双符号系统、定长编码、符号到整数的双射映射、用 2^n 计算所需位深——这些都是数字信息论的基础思想,在 Bacon 的双字母密码中已然完整呈现。
这就是为什么计算机史和信息论史的学者将 Bacon 的密码视为远超密码学奇珍的存在。它是数字时代真正的思想先驱,与现代二进制编码之间并无概念上的距离,有的只是时间上的间隔。
常见问题
Francis Bacon 真的写了莎士比亚的戏剧吗?
没有可信证据支持这一说法。主流学术界共识——有翔实的历史与文学分析作为支撑——认为斯特拉特福德的威廉·莎士比亚确实是署名作品的作者。培根理论者提出的密码学主张已被专业密码分析学家系统驳斥,最具决定性的驳斥来自 William 和 Elizebeth Friedman 1957 年的著作《莎士比亚密码考》。Friedman 夫妇证明,从莎士比亚文本中提取所谓培根密码消息所用的方法不具备科学有效性:这些方法足够灵活,可以在任何足够长的文本中"找到""消息"。
培根密码安全吗?
按现代密码学标准,不安全。培根密码使用固定的公开编码表,没有密钥变化。任何知晓该系统的人都可以立即解码任何消息。其安全性完全依赖于隐写术的隐蔽性:如果没有人怀疑存在隐藏消息,就不会被发现。一旦编码被察觉,解密则轻而易举。若要保护真正敏感的信息,需要使用 AES-256 等现代密码算法。
隐写术与密码学有何不同?
密码学将消息转化为不可读的形式——观察者知道秘密存在,但没有密钥就无法读取。隐写术隐藏消息的存在——观察者没有理由怀疑有任何秘密。培根密码将二者结合:消息被编码(密码学),编码再被隐藏在普通文本中(隐写术)。Bacon 认为隐写术层面的价值高于密码学层面,因为一条不引起怀疑的消息是无法被攻击的。
计算机能检测出培根密码隐写术吗?
在一定程度上可以。对文本的统计分析可以检测出大小写或字体中偏离自然写作预期规律的异常模式。现代数字取证工具可以识别文档文件中异常的字体元数据。然而,精心设计的隐写术——使用貌似合理的风格变化,例如出于设计原因自然混合字体的载体文本——自动检测起来要困难得多。在数字语境中,图像文件中的 LSB(最低有效位)嵌入等更复杂的隐写方法比基于文本的方式提供更好的隐蔽性。
历史上其他人物使用过哪些隐写方法?
历史上的隐写术出人意料地富有创意。据记载,古希腊人会剃光信使的头发,在头皮上刺上消息,待头发重新长出后再派他上路。用牛奶、尿液或柠檬汁制成的隐形墨水被广泛使用——书写内容只有在加热时才会显现。缩微照片——将照片缩小至句号大小——在两次世界大战中均被德国情报机构使用。无效密码(null cipher)将消息以离合诗的方式嵌入无害文本中(每个单词或句子的首字母拼出隐藏消息)。培根密码对字体变化的运用是历史上技术层面更为精密的方法之一,因为它不需要任何特殊材料——只需两种字体和一位知情的排版工。
结语
培根密码已有四百年历史,但在不同的情境中,它从未停止发挥作用。Bacon 将其发明为利用印刷车间资源进行秘密通信的实用工具。它因卷入莎士比亚著作权争议而声名大噪,也因此在某种程度上带上了争议色彩。它偶然间成就了美国最伟大的密码分析学家,在 William 与 Elizebeth Friedman 夫妇被推向现实世界的真实密码之前,训练了他们对密码主张进行严格分析的能力。它在地理寻宝、密室逃脱、竞技密码学以及二进制编码原理的教学中找到了舒适的余生。
最为重要的是,培根密码是思想史上最早的正式二进制编码系统之一——一种在晶体管发明前三个世纪、ASCII 诞生前三个半世纪、Unicode 联盟启动工作前整整四个世纪便已发明的五位字母表。
Francis Bacon 称其发明为双字母密码:一种由两个字母构成的密码。他同样可以称之为西方传统中第一个实用二进制编码系统。两种描述都准确,两者都说明了为何培根密码至今仍是真正具有历史价值的研究对象,而非单纯的考古奇珍。