Grammar learning has been a bottleneck problem for a long time. In this paper, we propose a method of semantic separator learning, a special case of grammar learning. The method is based on the hypothesis that some classes of words, called semantic separators, split a sentence into several constituents. The semantic separators are represented by words together with their part-of-speech tags and other information so that rich semantic information can be involved. In the method, we first identify t
2021-02-09 18:05:56 509KB semantic separator; separator learning;
1
k-infix:用于任意表达式的简单但通用的infix解析。 完全可定制。 附带实现的基本数学表达式
2021-02-03 01:37:22 11KB parsing infix ParsingRacket
1
名义上:用于记录链接的最大强度名称解析器 :link: 名字 名义上将以书写的个人名字简化并解析为六个核心字段:标题,,中间名,姓氏,后缀和昵称。 通常,名义上用于解析整个列表或名称。 该软件包包括一个命令行工具,用于解析单个名称,以便进行一次性测试和示例。 名义上产生的字段主要适合在数据集中或数据集中进行比较。 这样一来,名字的格式就不用考虑人的句法偏好了: de von ausfern, mr johann g Mr. Johann G. de von Ausfern de von ausfern, mr johann g Mr. Johann G. de von Ausfern de von ausfern, mr johann g而不是Mr. Johann G. de von Ausfern 。 :notebook: 入门 调用parse_name()解析六个核心字段: $ python -q >>> from nominally import parse_name >>> parse_name("Blankinsop, Jr., Mr. James 'Jimmy'"
2021-02-03 01:36:53 97KB parser data-science parsing record-linkage
1
重新打字 为最终解决ReasonML / OCaml打字稿互操作而进行的有目的的尝试。 为什么 我正在为Material UI维护一包自动生成的绑定。 随着原始程序包的复杂性增加以及希望涵盖所有内容的工具开始崩溃,生成这些绑定变得越来越令人沮丧。 这导致每个循环中丢失越来越多的类型,并通过调整类型提取过程来花费宝贵的时间来恢复它们。 现在,生成器使用一个将typescript转换成json-schema ,然后将其分析并解析为原因代码。 我相信这些工具想要覆盖太多的用例才能有效。 因此,我着手简化此过程,并可能提供一种有效的方法来概括reason和typescript之间的类型映射。 颇有野心。 走着瞧。 理念 re-typescript实现了它自己的词法分析器/解析器,专门用于分析typescript声明文件。 它故意不想要进入通过跟踪推断类型*.ts文件。 它只会尽最大可能提取干净定义的类型。 我还不确定如何处理无法解析的代码。 我相信最好的近似方法是最好的,它将通过仅注入某种抽象类型来优雅地结束遍历,而不是使类型失效或完全省略。 re-typescript首先从令牌化过程中
2021-02-03 01:36:47 2.38MB typescript parsing ocaml decoding
1
即兴解析器(FwIP)的乐趣 FwIP是一个概念验证应用程序,旨在说明如何解析正式的计算机语言以查找错误。 具体来说, fwip以JavaScript为目标,但是该项目中使用的概念可以应用于任何编程语言。 fwip和fwip本身背后的概念已于2019年3月28日在哥伦布OWASP上提出。类似的概念将于5月23日至24日在提出。 如果您在该地区,请过来看看! 安装和使用FwIP FwIP是写在Node.js ,这就需要你有Node.js系统上安装。 Node.js随NPM了一个软件包管理器,它将为您获取所有必需的依赖项。 npm install完node.js ,克隆此node fwip.js ,在根目录中运行npm install并运行cli node fwip.js $ git clone https://github.com/cetfor/fwip $ cd fwip $ npm install $ node fwip.js -h $ node fwip.js -a .\examples\owasp.html 分析本地文件 fwip可以分析单个文件或一批文件。 它专门查找以.
2021-02-02 20:36:13 3.93MB parsing antlr4 node-js bug-hunting
1
语义csv:用于处理CSV数据和文件的高级工具
2021-02-01 14:38:05 98KB clojure csv parsing ClojureClojure
1
timewords:多语言库,可轻松将日期字符串解析为java.util.Date对象
2021-02-01 11:17:00 51KB java natural-language-processing clojure parsing
1
很好的一本语法分析技术的理论书,该书为第一版,讨论了许多常见和特殊的分析技术。该书为文字预印版,pdf中文字可直接复制。也可直接打印成册。
2019-12-21 21:55:38 1.33MB 编译原理 分析技术 词法分析 语法分析
1
网上的 Parsing Techniques 文档都没有书签,查找起来不方便,于是我为其添加了书签目录,方便查阅。
2019-12-21 21:23:03 2.75MB 编译原理
1
比龙书好多了,3-7章深入本质而又高屋建瓴。对于被编译原理里面名目繁多的各式技术和术语搞得头昏脑胀的,建议读3-7章,会有登高望小之感。这个星球上对 Parser 写得最详细的书
2019-12-21 19:37:29 2.81MB 编译
1