首页 > 玄幻奇幻 > 脑回路清奇的主角们 > 幻当程序员小白用自然语言编程时会怎样？

幻当程序员小白用自然语言编程时会怎样？（1 / 2）

好书推荐：魔法漫记开局从抄语文课本开始诸天求凰诸天之明道炼金少女末世行难缠的甲方雇主伴生灵世界全球杀戮：觉醒逆天SSS级天赋我的艾美西亚人生将燃之枪

=数据卡尺=

如何用统计学的知识，来应用在数据上呢？

-第一步-

要弄明白统计学和数据之间的共性和非共性。

统计学：每一个数据无论其数值是多少，其本身就作为一个数值独占的存在体，然而统计学本身就有意和无意的忽略了各个数值的先后排列。

数据：每一个数据无论其数值是多少，其本身就作为一个数值独占的存在体，然而数据本身很注重各个数值的先后排列。

比如：abracadabra

用统计学来表示，就是a出现了5次，b出现了2次，c出现了1次，d出现了1次，r出现了2次。

用数据来表示，就是abracadabra。

那么如何把数据快速的解压缩出来呢？可以使用分段压缩方式，比如把一个大文件，分割成一个个片段，例如：

abracadabrathefoxjump张三和李四一起去喝酒。

那么，就可以根据前面的数据，本身就是采用英文的方式，也就是最多是52进制（区分大小写，而后面的中文可就麻烦了，毕竟中文本身进制相当大，那么就需要进行大进制处理。

用统计学的方法，就是把数据平均分，然后分割成可以互相对齐的数据个体，然后统计这些数据个体各出现了多少次。

然后进行统计，把统计数据记录下去。

也就是说，把大英百科全书的纯文本内容用统计学的方式记录下来，就能对应到大小写英文字母+符号+空格+换行+换页……

那么就能够统计出各英文字母出现过多少次，这导致的就是数据能够很好把所有元素给还原出来，只是这些元素之间的排列组合，就随着数据长度的变大而趋向更高运算量。

最简单的方法，就是用三种统计方法：

如字母矩阵：

acaefhiopqrtty

asdkfjaslkfdjla

skjfdasdfsadfas

dfasfasdfasfdas

新书推荐：史上最强霸主超级物流公司魔痕好人卡小霸王孙策极品大专生紫焰轮回信仰万岁全职法师之元素至尊以虫制霸