只为小站
首页
域名查询
文件下载
登录
train_LM.txt test_LM.txt
语言模型
python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果 山东大学2019 NLP实验1
2021-12-01 15:52:47
78KB
语言模型
1
personality-prediction:在各种著名的人格数据集上使用
语言模型
和心理语言特征进行自动人格检测的实验,包括论文集(标有“大五”的人格特征)-源码
语言模型
和自动人格预测 该存储库包含论文“ 代码,该论文发表在2020年IEEE国际数据挖掘大会上。 这是一组用tensorflow + pytorch编写的实验,旨在探索Essays数据集(使用Big-五个人格标记的特征)和Kaggle MBTI数据集上使用
语言模型
进行自动人格检测。 安装 通过以下方式从GitLab提取此存储库: git clone git@gitlab.com:ml-automated-personality-detection/personality.git 有关可通过以下方式安装的相关软件包的列表,请参见requirements.txt: pip -r requirements.txt 用法 首先运行LM提取器代码,该代码将数据集通过
语言模型
传递,并将(所有图层的)嵌入存储在pickle文件中。 创建此“新数据集”可为我们节省大量计算时间,并允许有效搜索超
2021-11-29 16:22:47
46.61MB
deep-learning
language-model
personality-predicting
Python
1
基于N元
语言模型
的文本分类方法
基于N元
语言模型
的文本分类方法.pdf 汉语n元模型统计软件.ppt 基于N元语法的汉语自动分词系统研究.pdf 一种基于N元语法分布的
语言模型
自适应方法.pdf
语言模型
的基本概念.doc N元
语言模型
的解码算法.doc N元
语言模型
的训练方法.doc 自动文本分类.pdf
2021-11-27 18:24:19
1.53MB
N元语言模型
文本分类
1
train_LM.txt
语言模型
python实现uni-gram和bi-gram 使用ppl困惑度对比模型效果 山东大学2019NLP实验1
2021-11-27 14:49:28
6.81MB
语言模型
1
P-tuning:一种新的方法来调整
语言模型
。 纸的代码和数据集``GPT也能理解''-源码
P-调整 一种新的方法来调整
语言模型
。 代码和数据集纸``GPT了解到,太“”。
2021-11-26 14:52:04
1KB
1
srilm-1.7.2
语言模型
训练工具,可以进行统计翻译项目,亲测可用。
2021-11-25 11:59:50
191.25MB
语言模型
1
基于标签和
语言模型
的分词算法
宗成庆书里面准确率最高的分词算法,代码有点错误,[c t]分母上的统计量应该是统计前几个字出现的字数而不是自身的个数,修改就可以进行分词,细节看里面的标注,参照给出的语料可以使用
2021-11-12 18:51:54
7KB
分词
1
NLP-Projects:word2vec,句子2vec,机器阅读理解,对话系统,文本分类,预训练的
语言模型
(即XLNet,BERT,ELMo,GPT),序列标签,信息检索,信息提取(即实体,关系和事件提取),知识图,文本生成,网络嵌入-源码
NLP项目 自然语言处理项目,其中包括有关以下方面的概念和脚本: gensim , fastText和tensorflow实现。 参见, doc2vec , word2vec averaging和Smooth Inverse Frequency实现 对话系统的类别和组成 tensorflow LSTM (请参阅 ,和 , ) fastText实现 ELMo,ULMFit,GPT,BERT,XLNet的原理 HMM Viterbi实现。 参见,中文解读 Named_Entity_Recognition 通过双向LSTM + CRF,张量tensorflow实现对NER品牌。 参见中文注释,中文解读 7_Information_retrieval 8_Information_extraction 9_Knowledge_graph 10_Text_generation 11
2021-11-10 10:37:45
412.66MB
information-retrieval
text-classification
word2vec
text-generation
1
FinBERT-QA:使用预训练的 BERT
语言模型
进行金融领域问答-源码
FinBERT-QA:使用 BERT 回答金融问题 FinBERT-QA 是一个问答系统,用于从数据集的任务 2 中检索有金融段落。 请参阅获取更多信息。 该系统使用来自信息检索和自然语言处理的技术,首先使用 Lucene 工具包检索每个查询的前 50 个候选答案,然后使用预训练的模型的变新排列候选答案。 FinBERT-QA 从 Huggingface 的库构建并应用 Transfer and Adapt [ ] 方法,首先将预训练的 BERT 模型转移并微调到一般 QA 任务,然后使用 FiQA 数据集将该模型适应金融领域。 转移步骤在的数据集上使用微调的 BERT 模型 ,它从 TensorFlow 转换为 PyTorch 模型。 在三个排名评估指标(nDCG、MRR、Precision)上结果平均提高了约 20%。 Overview of the QA pipeline:
2021-11-07 20:44:10
142.71MB
natural-language-processing
information-retrieval
deep-learning
question-answering
1
基于BERT+BiLSTM+CRF的中文景点命名实体识别
为解决旅游文本在特征表示时的一词多义问题, 针对旅游游记文本景点实体识别中景点别名的问题, 研究了一种融合
语言模型
的中文景点实体识别模型. 首先使用BERT
语言模型
进行文本特征提取获取字粒度向量矩阵, BiLSTM用于上下文信息的提取, 同时结合CRF模型提取全局最优序列, 最终得到景点命名实体. 实验表明, 提出的模型性能提升显著, 在实际旅游领域内景点识别的测试中, 与以往研究者方法比较下准确率, 召回率分别提升了8.33%, 1.71%.
2021-11-06 18:57:14
1.08MB
BERT语言模型
BiLSTM
条件随机场
景点实体识别
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
CNN卷积神经网络Matlab实现
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
VideoDownloadHelper去除120分钟时间限制-高级版.zip
基于OpenCV的车牌号码识别的Python代码(可直接运行)
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
stm32f103+OLED12864+FFT音乐频谱(多种显示效果 提供原理图)
房价预测的BP神经网络实现_python代码
夏天IC助手1.8你们懂的
python大作业--爬虫(完美应付大作业).zip
(推荐)小爱触屏音箱LX04_2.34.5-官改-(开发版)SP5
csma/ca和csma/cd的matlab仿真源代码带有详细的注释
EEMD算法应用于信号去噪.rar
最新下载
中文停用词表(比较全面,有1208个停用词)
centos下wget安装包
合成孔径雷达成像原理
小型医院信息系统(pb源码)
opencv安装包for-3.4.1-vc14_vc15
151 Trading Strategies.pdf
PCshare源代码合集,最终版本源代码
Wyse-USB-Imaging-Tool
联想bios 90KT23CUS和刷机工具
完整版 1 华为项目管理10大模板Excel版(可直接套用).xlsx
其他资源
尚硅谷SpringBoot整合技术篇-课件、笔记、示例代码
自由空间大气衰减计算公式.xlsx
CMS运营管理后台PRD
BM3D 图像去噪的matlab代码
基于单片机的银行排队叫号系统的设计代码
舌苔识别训练器.zip
websocket实现前端页面动态刷新数据库中数据
操作系统(第二版)习题答案
windows64位下的debug工具
TDMA算法 C语言编写
【精品】奇安信-网络安全等级保护安全体系建设方案汇报(通用要求版)V1.2-0526.pptx
JavaScript网页特效设计模板大全
含磷氮硫阻燃剂阻燃软质聚氨酯泡沫的研究
【ssm项目源码】物资管理系统.zip
Thinking_In_C++_2nd_Edition_Volume1.pdf
gradle-6.5.zip
CodeSmith数据库模板v3
吴恩达神经网络课程作业与答案
图书管理系统c#+sql server2005
BGS 背景建模/前景提取 集成软件