第六十七章 获得好处,解析文件(2/2)
作者:缺垚
破译工作。
破译文字远比解析科技要简单得多,而如果这份文件就是某个科技的详细报告的话,那破译这份文件等于获得了一个科技。
“我心心念的启灵装置啊!”苏御又感叹到,启灵装置关乎他能否再度进化,可他却迟迟没发现关于启灵装置的情报。
苏御给自己倒了杯咖啡,随后立刻开始了破译工作。
这份文件里的文字全都是用【、o、】、〖〗、Ш、╁、□之类的框框和线组成的,像极了word里进行加密的乱码文字。
但苏御立刻找到了规律,他发现“【”“(”这样的符号非常常见,那说明这类是语言的基本词汇量、常用词、常用固定搭配等等。
比如中文里的“的地得”、“这”、“那”、“是”、“不”“你我他”。
比如英文里的“is”、“the”、“to”
比如日文里的“の”“て”
理解这一点,那就比较好办了,文件中但凡是这类的文字全部都可以先用这几种常用词汇套入。
随后是断句,苏御发现有些方块字直接由一个空格将其隔开,因此将不同的字区分成不同的区域,每一个区域便可以理解成一句话。
然后是标注,作为一份报告,肯定是有标注,有特别说明,比如中文论文里的“注1”“注2”,或者()。
而这些文件内也有类似这样的标注,有了这些标注后,再去破解原文,难度就会降低许多。
而随后,就是纷繁复杂的统计学工作,将文件中所有的文字全部提取出来,提取出所有的常用文字,提取出偶尔使用的文字,提取出只是用过一次的文字。
从而再进行统计学分析,和目前人类已知的文字进行对照,寻找语法相似的文字。
众所周知,中文和英文互为倒装句。
简单来说,中文是:今天你吃了吗?
英文是:你吃了吗?今天。
而经过苏御长达数天的分析,万界统合的文字和中文的语法更为接近,这让苏御松了口气,因为中文的文字数量更多,更利于进行统计学对照分析。
苏御继续那万界统合的文字和中文进行对比,并用这种很笨的方法来破译万界统合的文字。
这将是一个漫长的过程,但苏御有的是时间。
而且,苏御可以偷懒,那就是他可以将算法和程序编入计算机,并借助计算机来为他破译万界统合的文字。
确定目标后,苏御立刻开始行动,他直接找到了世界上运算速度最快的“银河”超级计算机,并借助这台计算机进行破译。
重复性的工作全部交给计算机完成,苏御只需要从计算机给出的答案中筛选出错误的。
如此一遍又一遍,不断地将错误的破译筛选出去,留下正确的破译,直到文件中出现的大部分字都能正确地对照中文。
那时候,破译工作就会完成。
如此,苏御不断地坚持进行破译工作,在第三年,破译终于完成,文件中除了部分只出现过一次的词语,和部分专有名词外,其他的文字全部完成了破译。
而虽然只破译了85%的内容,但苏御也完全看懂这份文件上写的是什么了。
在看完这份报告后,苏御深吸了一口气。
他知道男爵为什么会遭到机械族的追杀了。