百合文库
首页 > 网文

幻当程序员小白用自然语言编程时会怎样?(2)

2023-06-28 来源:百合文库
然后进行统计,把统计数据记录下去。
也就是说,把大英百科全书的纯文本内容用统计学的方式记录下来,就能对应到大小写英文字母 符号 空格 换行 换页……
那么就能够统计出各英文字母出现过多少次,这导致的就是数据能够很好把所有元素给还原出来,只是这些元素之间的排列组合,就随着数据长度的变大而趋向更高运算量。
最简单的方法,就是用三种统计方法:
如字母矩阵:
A C A E F H I O P Q R T T Y T
A S D K F J A S L K F D J L A
S K J F D A S D F S A D F A S
D F A S F A S D F A S F D A S
F D J H L K J H L K J H L K J H
为了快速得知每个数字的排列方式,可以进行统计校验
每一行的第一列中出现A的次数为2次
每一行的第二列中出现A的次数为0次
第一行中出现A的次数为2次
第二行中出现A的次数为3次
A在整个文本中出现过12次

幻当程序员小白用自然语言编程时会怎样?


以此类推,就能使用数独的方式,逆推出去掉了很多排列组合的有限数量的排列组合方式,然后这些排列组合就能通过其他校验方式,比如MD5,比如SHA128和其他校验方式快速找出正确的排列组合。
这种方式,就是使用小公式重复使用的方式,快速生成数据的片段,然后只需要把数据片段进行拼图一样的整理就行了,就能还原出源文件。
之前说的,只应用到阶乘,N次方,无理数,都只适合于超级计算机的压缩方式,而这次介绍的,则是相对来说,更适合个人计算机,以及单片机使用,本身就是以硬件上限有限时,如何获得最高压缩率,以及最快解压缩。
同样的,把数据进行片段化,然后使用特定进制的方式来进行统计,同样可以统计出,然而还有一种特殊的进制转换对齐校验方式。
比如二进制的101010111010110111010001001101110010。
转换为4进制(00=A)(01=B)(10=C)(11=D):CCCDCCDBDBABADBDAC
转换为十进制:46,084,723,570
转换为16进制:A BADD 1372

幻当程序员小白用自然语言编程时会怎样?


猜你喜欢