耙子
RAKE是快速自动关键字提取算法的缩写,它是一种与域无关的关键字提取算法,它通过分析单词出现的频率及其与文本中其他单词的共现程度来尝试确定文本主体中的关键短语。
建立
使用点子
pip install rake-nltk
直接从存储库
git clone https://github.com/csurfer/rake-nltk.git
python rake-nltk/setup.py install
快速开始
from rake_nltk import Rake
# Uses stopwords for english from NLTK, and all puntuation characters by
# default
r = Rake ()
# Extraction given the text.
r . extract_keywords_from_text ( )
# Extraction given the list of strings where each string is a sentence.
r . extrac
1