文本分割作为监督学习任务
该存储库包含代码和补充材料,这些信息和补充材料是训练和评估模型所必需的,如论文“将
Downalod所需资源
wiki-727K,wiki-50数据集:
word2vec:
在configgenerator.py中填充相关路径,并执行脚本(git存储库包括Choi数据集)
创建环境:
conda create -n textseg python=2.7 numpy scipy gensim ipython
source activate textseg
pip install http://download.pytorch.org/whl/cu80/torch
1