日文餐具词表 概述 骰子是一种通过使用骰子从称为“骰子单词列表”的单词列表中随机选择单词来创建密码的方法。 该方法是一种可以轻松生成安全密码的方法,但需要“骰子词表”来实现。作为该单词列表,使用了英语版本的单词列表。 http://www.hyuki.com/diceware/diceware.wordlist.asc 但是在日本操作时,使用不熟悉的英文单词很难记住密码,很不方便,所以我们尝试准备了日文版的单词表。 方法 在形态分析器 Juman 的词典中,我们准备了一个脚本,它只从 ContentW.dic 中提取名词,其中包含基本词汇,并删除了使罗马字母表混乱的词汇。 在Debian GNU / Linux的情况下,可以通过执行以下命令来复制单词列表。 sudo apt-get install juman-dic perl convert.pl /usr/share/juma
2021-05-29 16:02:39 104KB Perl
1
在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。
2021-05-13 09:03:40 20KB 中文停用词表
中文最全停用词表
2021-05-11 15:28:36 44KB 停用词表 中文分词
1
NLP 整合后的停用词表 总共含1286个词
2021-05-01 23:37:54 4KB NLP 停用词表 stopwords
1
中文常见的停用词表 文档
2021-04-26 08:14:46 9KB 停用词
1
详细记录了unity3D开发常用的英语单词,很适合新手使用。
2021-04-24 19:58:37 19KB unit
1
多版本 中文停用词表 英文停用词表 中英文停用词表 以及python停用词词表合并程序(2个)
1
此为哈工大停用词表,可用于分词使用。语言技术平台(LTP) 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术。经过 哈工大社会计算与信息检索研究中心 11 年的持续研发和推广,LTP 已经成为国内外最具影响力的中文处理基础平台,曾获 CoNLL 2009七国语言句法语义分析评测 总成绩第一名,中文信息学会钱伟长一等奖等重要成绩和荣誉。目前,LTP 已经被 500 多家国内外研究机构和企业使用,多家大企业和科研机构付费使用。
2021-04-17 15:04:13 39KB 分词
1
新标日初级上册单词表单词分类打印版
The Range program is used for analysing the vocabulary load of texts. It can tell you how much and what vocabulary occurs in a particular text or group of texts. It used to be called VORDS, FVORDS, and VocabProfile. It is available here to download with either the GSL/AWL lists (General Service List / Academic Word List) or with the British National Corpus lists, plus instructions for using the program. 包括basewrd词表文件和range32.exe,range32h.exe(BNC_COCA_25000.zip、Range_GSL_AWL.zip、BNC-14000-and-programs-and-instructions.zip、Information-on-the-BNC_COCA-word-family-lists-20180705.pdf、range-level-three-partial.zip)
2021-04-06 14:13:48 2.32MB 自然语言处理 NLP 语料库 词表
1