上传者: 42134143
|
上传时间: 2021-12-28 22:47:54
|
文件大小: 63KB
|
文件类型: -
Kaggle的Quora重复问题检测比赛的解决方案
可以通过以下链接找到比赛: ://www.kaggle.com/c/quora-question-pairs使用该解决方案,我在3307个团队中排名第23(最高1%)。 考虑到其他顶级解决方案,这是一个相对轻量级的模型。
先决条件
从下载预训练的单词向量,即Gloves.840B.300d,并将其放入项目目录。
从下载火车和测试数据。 创建一个名为“数据”的文件夹并将其放入。
将所有软件包安装在requirements.txt中。
管道
该代码是用Python 3.5编写的,并在装有Intel i5-6300HQ处理器和Nvidia G