|
重要提示:其实这是一种编码,并不算加密(加密必定要密钥的)
让我们从历史说起
很久以前,计算机使用的是英文,使用ASCII编码,每个英文字符占1字节(8位),范围0-127(128-255留给了Unicode等多国编码)。请注意,是半角的字符(窄字符)。让我们来验证一下:
新建一个记事本,用半角(即英文)方法输入“Hello,World!”(可以复制,但是不要复制多了)。保存为1.txt,然后用十六进制编辑器(MiniHex,Winhex,VS等打开,如图)
文本总共12个字符,刚好对应12个字节。
但是,刚才这个ASCII只能最多表达128个字符。然而,中文可远远不止128个字符,于是,Unicode(UTF-8)出现了。
Unicode标准采用2个字节表达1个字(中文字或者其他语言)。记事本等东西会将相邻的两个字节“拼合”在一起表示一个字。然而,你会说ASCII相邻的两个字节为什么不会被解释为一个字呢?这是因为Unicode字的第一个字节值大于128(还记得ASCII范围吗?),只要遇到一个字节大于128,就会自动拼合。
基于这个原理,要编码也就很简单了。
以下为一段源程序。1.txt——源文件 2.txt——“加密”后的文件
.版本 2
.子程序 加密
.局部变量 bin, 字节集
bin = 读入文件 (“1.txt”)
bin = { 234 } + bin
写到文件 (“2.txt”, bin)
原理很简单。以下解释一下。
既然我们知道每个大于128的字节会与后面的结合,我们将bin在头部插入一个大于128的字节。这样,这个字节会与后面的结合,原来的第二个字节本来要和第一个字节结合的,但由于第一个字节已经和插入的那个字节结合了,于是原来的第二个字节就和第三个字节结合了,如此类推,源文件的内容完全被打乱了
解密也很简单,删去第一个字节即可。代码如下:
.版本 2
.子程序 解密
.局部变量 bin, 字节集
bin = 读入文件 (“2.txt”)
bin = 取字节集右边 (bin, 取字节集长度 (bin) - 1)
写到文件 (“3.txt”, bin)
3.txt是解密后的文件。
测试一下:
看起来挺好的。我们的文本就被改变了编码。
但是有一个问题:如果文本中有一个ASCII字符怎么办?
这样的话,只有ASCII字符前面的东西可以加密,后面的不行了。如图
为什么呢?因为ASCII字符只占一个字节,下面的内容可能表示这点。
1.txt:
00 01 02 03 04 05 06 (字节)
[字符1 ][字符2 ][A ][字符4 ](“字符”指中文字,A指ASCII字符)
2.txt:
00 01 02 03 04 05 06 07
[P ][字符1 ][字符2 ][A ][字符4 ](P表示插入的字节)
----------- ----------- ----------- ------------
划线部分会被结合为宽字符。
这样,字符4的前段对齐结合线,于是就正常显示出来了。
这个问题在文本里面有奇数个ASCII字符时会出现,偶数个不会。思考:为什么?
偶数个ASCII相当于一些中文字,不会改变原文中的对齐关系。
我们称这种“加密”为错误对齐加密。
但是,我们为了解决那个问题,想出了下面的办法。
如果在每个字节前面都加上一个大于128的字节,就不会有这样的问题。(如果不是大于128,那么如果插入的前一个字符在ASCII范围内,原文的ASCII还是会显示)
这样的话,相当于先将原文拆分为一个一个字节,然后强制将每一个字节都组合为一个中文字。这样的话,就不会看到原文的任何内容。
代码:(编辑框1是指输入文本的编辑框)
.版本 2
.子程序 _按钮1_被单击
.局部变量 bin, 字节集
.局部变量 bin2, 字节集
.局部变量 i, 整数型
bin = 到字节集 (编辑框1.内容)
.计次循环首 (取字节集长度 (bin), i)
bin2 = bin2 + 取字节集中间 (bin, i, 1) + 随机字符 ()
.计次循环尾 ()
写到文件 (“加密后.txt”, bin2)
.子程序 随机字符, 字节集
.局部变量 随机, 整数型
.局部变量 bin, 字节型
置随机数种子 ()
随机 = 取随机数 (128, 255)
bin = 到字节 (随机)
返回 (到字节集 (bin))
解密:
.版本 2
.局部变量 bin, 字节集
.局部变量 bin2, 字节集
.局部变量 i, 整数型
bin = 读入文件 (“加密后.txt”)
.计次循环首 (取字节集长度 (bin) ÷ 2, i)
bin2 = bin2 + 取字节集中间 (bin, i × 2 - 1, 1)
.计次循环尾 ()
编辑框1.内容 = 到文本 (bin2)
解密就是删除插入的字符。
很好,看看效果!
看不到了吧!
如果不是128以上的话:
* * * * * * * *
还是可以看到什么,ASCII原文每隔一个字符就看到一个。
我们已经完成了一个不错的“加(bian)密(ma)”算法,很好!
顺便:提醒管理员:能不能加入一个consolas或者courier new这种等宽字体,写文档对齐更方便!
|
评分
-
查看全部评分
|