地址信息作为空间信息,在各行各业中的应用越来越广泛,通过日常地址和标准地址匹配获取到标准地址的经纬度的应用很广泛,目前在匹配中使用深度学习Bert模型的方法对地址进行分段分级,通过分级信息,对地址济宁精准匹配。
1
针对现有的地址匹配算法地址要素切分存在歧义、匹配率和准确率低等问题,提出一种多策略结合的地址匹配算法。利用双向最大匹配分词算法提取有歧义的地址要素,通过建立地址要素特征字词典与地址标准数据库,对歧义结果进行首次歧义消除,再利用基于序列标注的中文分词进行二次歧义消除,将得到的各地址要素匹配数据库后计算相似性匹配得分,最后按照各地址要素的重要程度分配权重,加权求和后得到匹配总得分。结果表明,该算法优于其他传统的地址匹配算法,提高了地址匹配的匹配率与准确率。
2022-10-10 14:50:42 1.04MB
1
编写名为strdup的函数,此函数使用动态存储分配来产生字符串的副本。例如调用 • p= strdup(str); • 将为和str相同的字符串分配空间,并且把字符串str的内容 复制给新字符串,然后返回指向新字符串的指针,如果非配 失败则返回空指针。
2022-05-11 10:35:17 387B strdup 动态存储分配 地址匹配
1
IP地址匹配验证典型算法.doc
2022-05-08 19:07:37 29KB 算法 文档资料 tcp/ip 网络协议
本文提出了一种“基于分词的地址匹配技术”,它是通过构造一种分级地址库的方法, 并转换成地址分词库,采用基于地址词典的中文分词技术,实现地址匹配。采用这种方法, 易于维护修改地址库,并构建一个可自学习的地址库,不断丰富完善,提高匹配范围与匹配 精度。
2022-02-08 16:10:00 1.16MB 分词 地址 匹配
1
由于中文的内涵多义性和形式多样性的特点,使中文地址长期以来存在着难以标准化的问题,对进一步开展地址定位、区域网格分析和社情、舆情定位等工作都造成了较大的障碍。针对这个问题提出了基于地址分级模型和有限状态机驱动的新方法,并通过软件开发对这种方法的地址识别率和匹配准确率进行了验证,实验结果显示该方法对中文地址能够达到96%左右的识别率,匹配准确率也达到了85%左右,并且还能实现标准地址库的自动化更新。因此,采取该方法能够有效地解决中文地址标准化困难的问题,具有显著的实用性和研究参考价值。
1
处理中文地址的分词和匹配 采用混合分词算法进行中文地址分词 在中文地址分词基础上采用Double Levenshetin算法进行中文地址相似度进行地址匹配
2021-10-18 20:05:11 18.05MB 地址分词 地址匹配 Levenshtein 中文地址
1
处理中文地址的分词和匹配 采用混合分词算法进行中文地址分词 在中文地址分词基础上采用Double Levenshetin算法进行中文地址相似度进行地址匹配
2019-12-21 19:50:06 18.08MB 中文地址 地址分词 地址匹配 Levenshtein
1