表情符号2vec
一个演示项目,用于使用Twitter数据播放单词嵌入和表情符号。 让我们看看如何制作更智能的表情符号预测器。
信不信由你,我们有1800多种来自标准Unicode的表情符号。 如何从他们那里找到一个? 传统上,我们搜索表情符号描述的关键字。 我们将使用词嵌入来找到与上下文最匹配的词。 结果反映了社交媒体上真实用户的习惯。 现在,您将被最知识渊博的表情符号大师指导:)
检查站点 ,以预览我们接下来可以使用该模型做什么!
数据
文件夹中的zip文件是100万个句子,其中包含来自Twitter的有关2017年1月的表情符号。 它是从更大的语料库中随机选择的集合。 将corpu
1