甲言Jiayan 简介 甲言,取“Oracle言”之意,是一种专注于古汉语处理的NLP工具包。目前通用的汉语NLP工具均以现代汉语为核心语料,对古代汉语的处理效果很差(详见)。本项目的初衷,便是辅助古汉语信息处理,帮助有志于挖掘古文化矿藏的古汉语学者,爱好者等更好的地分析和利用文言资料,从“文化遗产”中创造出“文化新产”。当前版本支持,,,和五项功能,更多功能正在开发中。 功能 利用无监督的双,以及左右进行文言词库自动生成。 利用无监督,无词典的和进行古汉语自动分词。 利用词库合成功能产生的文言词典,基于有向无环词图,句子最大概率路径和动态规划算法进行分词。 根据词的的序列标注,词性详见。 基
1
降价格式的中国古书战国策。 你可以: 在线阅读 fork 这个 repo 将其转换为其他格式 随你心意。 文本属于公共领域。 我将原始 html 文件放在 wikisource 目录中。 您还可以在该目录中找到我编写的用于下载和转换它们的脚本。 我认为它们可能对处理来自 wikisource 的其他文本很有用。
2021-07-03 18:03:22 729KB Shell
1
这是一个古老的中国时钟,根据Shobogenzo(Tanahashi版)中的描述进行。 它是中国古代时钟和现代时钟的结合。 需要互联网连接,因为它需要下载您所在位置当前日期的日出和日落时间(位置名称和GPS坐标)
2021-05-14 15:03:48 1.2MB 开源软件
1
Nondestructive Raman spectroscopy and external-beam proton-induced X-ray emission (PIXE) technique to analyze eight ancient glasses unearthed from the provinces of Henan, Hubei, and Jiangsu, which allowes for a good characterization of the glass matrix and chemical compositions, is carried out. The results indicate that all the eight glass samples could be typically divided into three systems: faience (sample No. SZWG-4), PbO-BaO-SiO2 (sample Nos. NYWKI-5-1, HNWKII-88, and HNWKII-84), and Na2OCa
2021-02-26 09:05:47 605KB 无损鉴定 拉曼光谱 PIXE 中国古代
1