名义上:用于记录链接的最大强度名称解析器 :link: 名字 名义上将以书写的个人名字简化并解析为六个核心字段:标题,,中间名,姓氏,后缀和昵称。 通常,名义上用于解析整个列表或名称。 该软件包包括一个命令行工具,用于解析单个名称,以便进行一次性测试和示例。 名义上产生的字段主要适合在数据集中或数据集中进行比较。 这样一来,名字的格式就不用考虑人的句法偏好了: de von ausfern, mr johann g Mr. Johann G. de von Ausfern de von ausfern, mr johann g Mr. Johann G. de von Ausfern de von ausfern, mr johann g而不是Mr. Johann G. de von Ausfern 。 :notebook: 入门 调用parse_name()解析六个核心字段: $ python -q >>> from nominally import parse_name >>> parse_name("Blankinsop, Jr., Mr. James 'Jimmy'"
2021-02-03 01:36:53 97KB parser data-science parsing record-linkage
1