中文分词:采用二元词图以及viterbi算法.docx
2022-05-25 19:06:26 746KB 算法 中文分词 自然语言处理 nlp
代码来源:flyai 深度学习框架:tensorflow 公众号:深度学习视觉 完整代码获取:公众号后台回复(命名实体识别demo代码解读) 主要部分 Embedding input: 所有文字的字典文件,{index:word,…}; 所有文字的embedding文件,{word:embedding,…}; output: 将字典中的文字全部用embedding表示,{index:embedding}。 tensorflow提供索引的方式,每次索引对应word的embedding向量。 Dataset input_x:[batch_size,max_sentence_length,embe
2022-05-25 13:50:09 56KB demo em label
1
Chinese Treebank 8.0 LDC中文句树库(LDC2013T21),已标注句子的各个词语词性、句中成分、语义信息,可用于自然语言处理的句法分析或词性标注等任务。
2022-05-25 13:43:46 23.39MB nlp 自然语言处理 语料库 句树
1
「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑。目前常见的情感极性分析方法主要是两种:基于情感词典的方法和基于机器学习的方法。这个代码是基于情感词典的方法,代码可运行。
2022-05-25 09:13:42 1009KB NLP
1
相信同学们对NLP自然语言处理都有一定的了解,它是人工智能领域特别重要的一门课程,而且难度和融合度也是非常高的一门课程。因此它的复杂程度也是相当之高,所以同学们需要沉下心,耐住性子的使劲琢磨,不放过任何一个技术细节,把精髓内容掌握在手,更能在项目中脱颖而出。
2022-05-25 09:09:20 208B 自然语言处理 文档资料 人工智能 nlp
1
唐诗一百首 数据集 先帝侍女八千人,公孙剑器初第一。 五十年间似反掌,风尘[氵项]洞昏王室。 梨园子弟散如烟,女乐馀姿映寒日。 金粟堆前木已拱,瞿塘石城草萧瑟。 玳筵急管曲复终,乐极哀来月东出。 老夫不知其所往,足茧荒山转愁疾。 漫叟以公田米酿酒,因休暇,则载酒于湖上, 时取一醉;欢醉中,据湖岸,引臂向鱼取酒, 使舫载之,遍饮坐者。意疑倚巴丘,酌於君山 之上,诸子环洞庭而坐,酒舫泛泛然,触波涛 而往来者,乃作歌以长之。
2022-05-24 00:00:44 28KB nlp数据集
1
NLP实验一有限自动机
2022-05-23 10:04:13 977B 自然语言处理 人工智能 nlp
NLP实验二 二元文法模型
共用12个文件,分为英文和中文。其中中文情感词典包括:评价、情感、主张、程度(正面、负面)的情感文本。可用于中文文本分析中情感分析,计算情感词语等。
2022-05-22 15:53:54 88KB 文档资料 自然语言处理 nlp
1
ml-projects:基于ML的项目,例如垃圾邮件分类,时间序列分析,使用随机森林进行文本分类,深度学习,贝叶斯,Python中的Xgboost
2022-05-19 01:00:19 9KB nlp docker machine-learning deep-learning
1