上传者: 42116705
|
上传时间: 2022-01-19 15:09:17
|
文件大小: 10KB
|
文件类型: -
自然语言处理项目
该项目调查自然语言处理 (NLP) 中的一个主题,同时练习 AVL 树数据结构。 在 NLP 中,人们经常需要计算每个特定单词在文本中出现的次数。
对于语言建模,人们通常需要知道有多少不同的单词恰好在文本中出现了 r 次。 令 N(r) 是恰好出现 r 次的不同单词的数量。 因此,该程序可以根据给定的文本有效地计算 N(r)。
文本文件通过命令行参数指定,N(r)'s 在单独的行上打印到标准输出。