上传者: 42134537
|
上传时间: 2021-11-29 16:22:47
|
文件大小: 46.61MB
|
文件类型: -
语言模型和自动人格预测
该存储库包含论文“ 代码,该论文发表在2020年IEEE国际数据挖掘大会上。
这是一组用tensorflow + pytorch编写的实验,旨在探索Essays数据集(使用Big-五个人格标记的特征)和Kaggle MBTI数据集上使用语言模型进行自动人格检测。
安装
通过以下方式从GitLab提取此存储库:
git clone git@gitlab.com:ml-automated-personality-detection/personality.git
有关可通过以下方式安装的相关软件包的列表,请参见requirements.txt:
pip -r requirements.txt
用法
首先运行LM提取器代码,该代码将数据集通过语言模型传递,并将(所有图层的)嵌入存储在pickle文件中。 创建此“新数据集”可为我们节省大量计算时间,并允许有效搜索超