我们发现了一种未知的语言,现只知道其文字是以 20 个字母构成的。我
们已经获取了许多段由该语言写成的文本,但每段文本只是由字母组成的序
列,没有标点符号和空格,无法理解其规律及含义。我们希望对这种语言开展
研究,有一种思路是设法在不同段文本中搜索共同出现的字母序列的片段。
语言学家猜测:如果有的序列片段在每段文本中都会出现,这些片段就很可
能具备某种固定的含义 (类似词汇或词根),可以以此入手进行进一步的研究。
在文本的获取过程中,由于我们记录技术的限制,可能有一些位置出现了记
录错误。可能的错误分为如下三种:
1. 删失错误:丢失了某个字母;
2. 插入错误:新增了原本不存在的字母;
3. 替换错误:某个字母被篡改成了其他的字母。
2022-04-06 21:16:21
84KB
认证杯
1