上传者: 19590273
|
上传时间: 2021-12-10 10:53:02
|
文件大小: 480KB
|
文件类型: -
一种基于有限状态机的中文地址标准化方法
一 种基 于有 限状态机 的中文地址标 准化 方法 水 罗 明 ,黄海量 (上海财经大学 a.信息管理与工程学院;b.上海市金融信息技术研 究重点实验 室,上海 200433) 摘 要:由于中文的内涵多义性和形式多样性的特点,使 中文地址长期 以来存在着难以标准化的 问题 ,对进 一 步开展地址定位、区域 网格分析和社情、舆情定位等工作都造成 了较大的障碍。针对这个问题提 出了基于地址 分级模型和有限状态机驱动的新方法,并通过软件开发对这种方法的地址识 别率和匹配准确率进行 了验证 ,实 验结果显示该方法对中文地址能够达到 96%左右的识别率 ,匹配准确率也达到 了85%左右,并且还能实现标准 地址库的 自动化更新 。因此,采取该方法能够有效地解决 中文地址标准化 困难的问题 ,具有显著的实用性和研