语言模型和自动人格预测 该存储库包含论文“ 代码,该论文发表在2020年IEEE国际数据挖掘大会上。 这是一组用tensorflow + pytorch编写的实验,旨在探索Essays数据集(使用Big-五个人格标记的特征)和Kaggle MBTI数据集上使用语言模型进行自动人格检测。 安装 通过以下方式从GitLab提取此存储库: git clone git@gitlab.com:ml-automated-personality-detection/personality.git 有关可通过以下方式安装的相关软件包的列表,请参见requirements.txt: pip -r requirements.txt 用法 首先运行LM提取器代码,该代码将数据集通过语言模型传递,并将(所有图层的)嵌入存储在pickle文件中。 创建此“新数据集”可为我们节省大量计算时间,并允许有效搜索超
1