本项目是自然语言处理NLP在中文文本上的一些简单应用,如文本分类、情感分析、命名实体识别等。
文本分类
数据集用的是头条的标题和对应文章分类数据。数据集来自这里:
文本分类的例子对应zh_article_classify_bilstm_attention.ipynb,这里构建的是BiLSTM+Attention的模型结构。
具体模型搭建如下:
def create_classify_model(max_len, vocab_size, embedding_size, hidden_size, attention_size, class_nums):
# 输入层
inputs = Input(shape=(max_len,), dtype='int32')
# Embedding层
x = Embedding(vocab_size, embedding_size)(
1