利用500万条微博语料对微博评论进行情感分析-附件资源
2022-04-25 20:22:43 106B
1
古汉语常用字字典《古汉语常用字字典》是1979年商务印书馆出版的图书,作者是王力、岑麒祥、林焘、戴澧、唐作藩、蒋绍愚、张万起、徐敏霞。该书是新中国成立后第一部用现代语言学和辞书学观点、方法编写的古汉语权威字典。
2022-04-21 11:07:17 1.31MB 字典 语料
1
里面包含三个语料库,分别是台湾大学,清华大学,以及微博语料
2022-04-19 14:12:34 8.46MB 语料分析
1
该资源包含了数据集、源码以及说明文档
2022-04-15 15:28:30 237.08MB NLP sentimentanalys 英文语料
1
cpp代码-语料字典1
2022-04-13 22:35:30 1KB 代码
1
如题,三个完整的机器翻译平行语料,免去官网的麻烦申请操作等
2022-04-06 23:59:41 290.22MB 平行语料 casia2015 casict2015
1
PTT 中文语料 嗨,这里是PTT中文语料集,我透过将每篇文章化简为问答配对,其中问题来自文章的标题,而回覆是该篇文章的推文。可惜的是目前这份资料集的噪声还有点大,若您有更好的方法能提取出文章的问答配对,或发现这份资料集有什么能改进的部份,还请与我联系,也祝各位开发顺利:> 资料说明 资料集一共有两份,您可于或是从本专案的data资料夹里取得。 Gossiping-QA-Dataset.txt 搜集了PTT八卦版于2015年至2017年6月的文章,每一行都是一个问答配对,问与答之间以一个tab ( \t )区隔开,比如说 matlab有什麼炫砲一點的圖? 一樣的圖改一改顏色,有點半透明感覺更唬爛炫 有沒有情人節吃什麼cp值最高的八卦 吃屎啊廢話 免費的一餐 姆咪一個人守得住街亭嗎? 引來一堆肥宅穢土轉生 有機會喔 有沒有被落石砸到該反省的八卦 蔡英文執政就故意誇大報導 東森不意外 情人節
2022-04-02 15:40:15 133.63MB chatbot dialog corpus dataset
1
用于生成训练语料,供文本分类器使用。在控制台操作,简单易用
2022-03-26 22:12:59 8KB 文本分类 训练语料
1
FileWriter writer1 new FileWriter "汉字字频统计结果分布 txt" ; writer1 write "汉字总数 "+totalNum+" r n" ; 汉字总个数 writer1 write "汉字种数 "+totalKind+" r n" ; 汉字种类数 writer1 write " r n" ; writer1 write " r n" ; writer1 write "带 的为高频字 r n" ; writer1 write "序号 t汉字 个数 t 字频 字频和 r n" ; 字频 词频统计并可统计汉字信息熵 含语料 100篇 完整">FileWriter writer1 new FileWriter "汉字字频统计结果分布 txt" ; writer1 write "汉字总数 "+totalNum+" r n" ; 汉字总个数 writer1 write "汉字种数 "+totalKind+" r n" ; 汉字种类数 writer1 write " r n [更多]
2022-03-23 07:49:06 90KB 字频 词频统计 含语料
1
微软亚洲研究院中文分词语料库_自然语言处理_科研数据集
2022-03-22 20:48:45 40.82MB 中文分词语料
1