上传者: 38615397
|
上传时间: 2022-04-18 02:46:28
|
文件大小: 50KB
|
文件类型: PDF
最近工作需要用到序列匹配,检测相似性,不过有点复杂的是输入长度是不固定的,举例为:
input_and_output = [1, 2, '你好', 世界', 12.34, 45.6, -21, '中国', '美丽']
其中,需要从input_and_output 中选取不固定长度的一段作为输入,且顺序不定,然后去与总体进行比较,找出最符合的,开始是对汉字进行数值化编码,不过后来由于出现汉字越来越多,遂放弃该方法,转向别的方式,查找资料发现了两个python包广被推荐,从下面来看各有优缺点,记录之~
1、difflib
import difflib #python 自带库,不需额外安装
In