Fasttext 用新闻数据进行模型训练 训练结果库
2022-05-29 12:05:41 746.35MB NLP Fasttext
1
自然语言学习——使用FastText用每日新闻预测金融市场变化一文中的源代码,数据集,参考资料,但是nltk中的stopword以及其他扩展包没有放进去,还有一些python库需要自行下载。
2022-05-09 13:53:23 1.84MB nlp
1
自动生成图片描述是自然语言处理和计算机视觉的热点研究话题,要求计算机理解图像语义信息并用人类自然语言的形式进行文字表述.针对当前生成中文图像描述整体质量不高的问题,提出首先利用FastText生成词向量,利用卷积神经网络提取图像全局特征;然后将成对的语句和图像〈S,I〉进行编码,并融合为两者的多模态特征矩阵;最后模型采用多层的长短时记忆网络对多模态特征矩阵进行解码,并通过计算余弦相似度得到解码的结果.通过对比发现所提模型在双语评估研究(BLEU)指标上优于其他模型,生成的中文描述可以准确概括图像的语义信息.
1
fasttext,基于windows的工具,可以用作文本分类,文本表达。FastText for Windows (2017-05-15)
2022-03-21 16:37:42 847KB fasttext
1
fasttext 0.9.2 最新release版本,windows下的命令行工具,支持autotune等最新功能。
2022-03-21 15:48:47 231KB fasttext windows
1
word2vec/fasttext绘图中所需的藏文字体,若不需要可视化藏文字体,请不要下载!
2022-02-14 16:09:27 559KB word2vec 人工智能 nlp 自然语言处理
1
tensorflow + fasttext 实现文本分类及原理-附件资源
2022-02-14 15:14:36 106B
1
针对词向量文本分类模型记忆能力弱, 缺少全局词特征信息等问题, 提出基于宽度和词向量特征的文本分类模型(WideText): 首先对文本进行清洗、分词、词元编码和定义词典等, 计算全局词元的词频-逆文档频度(TF-IDF)指标并将每条文本向量化, 将输入文本中的词通过编码映射到词嵌入矩阵中, 词向量特征经嵌入和平均叠加后, 和基于TF-IDF的文本向量特征进行拼接, 传入到输出层后计算属于每个分类的概率. 该模型在低维词向量的基础上结合了文本向量特征的表达能力, 具有良好的泛化和记忆能力. 实验结果表明, 在引入宽度特征后, WideText分类性能不仅较词向量文本分类模型有明显提升, 且略优于前馈神经网络分类器.
2022-01-07 09:59:39 995KB Word2Vec FastText WideText 文本分类
1
使用fasttext工具实现word2vec的数据集enwik9
2022-01-03 18:04:08 953.67MB python NLP
著名的fasttext词向量,上Billion个词,每个词N维,可用于深度模型初始化,BERT之后仍有其价值
2021-11-23 12:45:55 760.15MB NLP
1