使用TensorFlow和通用句子编码器进行下一个单词预测
该项目正在利用一种转移学习的方法,即使用Google的通用句子编码器在给定包含5个单词的字符串的情况下预测下一个单词。
通用句子编码器包装在带有Tensorflow的Lambda层中,并堆叠在递归层的顶部,然后是softmax层,以为下一个单词提供概率分布。 该模型在包含数百万行英语的美国博客的数据集上进行了训练。 由此,我正在使用滑动窗口方法来获取模型的训练样本和标签。 使用过采样方法(例如SMOTE)面临类不平衡的问题。
该模型使用Flask包装到API中,并且可以在本地主机上运行。
Linux / macOS的用法
创建一个虚拟环境
python3 -m venv env
激活虚拟环境:
source env/bin/activate
安装要求:
pip install -r requirements.txt
2021-11-27 16:24:45
11.29MB
Python
1