【课程3.4】 文本序列str常用操作 字符串是 Python 中最常用的数据类型。我们可以使用引号(‘或”)来创建字符串 字符串也是序列:文本序列 1.字符串引号 str1 = "abc" str2 = 'abc' str3 = 'my name is "fatbird"' # 双引号单引号无区别,但文本中有引号的时候要相互交替使用 str4 = '''hello! how are you? I`m fine, thank you.''' # 需要多行字符串时候用三引号 ''' ''',""" """ 2.转义字符:\ print('\'', '\"') # \',\
2023-03-04 09:24:32 66KB python st str
1
在NLP中,数据清洗与分词往往是很多工作开始的第一步,大多数工作中只有中文语料数据需要进行分词,现有的分词工具也已经有了很多了,这里就不再多介绍了。英文语料由于其本身存在空格符所以无需跟中文语料同样处理,如果英文数据中没有了空格,那么应该怎么处理呢? 今天介绍一个工具就是专门针对上述这种情况进行处理的,这个工具叫做:wordninja,地址在这里。 下面简单以实例看一下它的功能: def wordinjaFunc(): ''' https://github.com/yishuihanhan/wordninja ''' import wordninja print word
2023-03-04 00:25:50 50KB dn IN ni
1
语义文本相似度 Anant Maheshwari Simeng Sun Danni Ma Yezheng Li 抽象的 语义文本相似度(STS)衡量句子的含义相似度。 该任务的应用包括机器翻译,摘要,文本生成,问题解答,简短答案分级,语义搜索,对话和会话系统。 我们开发了具有多种功能的支持向量回归模型,包括使用基于比对的方法和基于语义组合的方法计算的相似度得分。 我们还使用BiLSTM和卷积神经网络(CNN)训练了句子的语义表示。 在测试数据集中,我们系统输出的人类评级之间的相关性高于0.8。 介绍 此任务的目的是测量给定句子对之间的语义文本相似性(它们的含义,而不是它们在语法上是否看起来相似)。 尽管进行这样的评估对人类来说是微不足道的,但是构建模仿人类水平性能的算法和计算模型却代表了一个困难而深刻的自然语言理解(NLU)问题。 范例1: 中文:小鸟在水盆里洗自己。 英文释义:这只鸟
2023-03-03 16:24:05 2.28MB Python
1
一款专业的高性能pdf 文本内容提取软件,支持linux,windows平台,能对文档内的段落和表格进行精确提取,将pdf 文档转成html、xml、json、txt 等4 种格式,并做到一次解析,多种格式同时输出,方便用户高效获取pdf 文档内的精确信息或数据。此外,Pdftranspro 还提供pdf文档截取合并等实用的pdf 编辑功能。
2023-03-03 09:19:57 89.11MB PDF转html PDF转xml PDF转json pdf文本提取
1
整合阿里云进行文本转语音(Springboot+vue),前后端都有,每次可以将文本转化为你想要的的语音,mp3等格式,阿里云语音支持包括山东化,四川话,天津话,广播腔,英文,美式,英式,日语、等国家的语音。配合开发文档很容易整合进你的项目。文档连接:https://blog.csdn.net/lllmmm13/article/details/126446983?spm=1001.2014.3001.5501
2023-03-02 23:32:29 16KB 源代码
1
微信小程序-面包旅行:界面设计,文本展示.zip,小程序模板代码,可以直接从源码里粘贴复制过来,虽然这样做不利于自己独立编写代码。
1
读取文本文件到EXCEL并对数据进行操作
2023-03-02 16:49:32 212KB EXCEL 文件 C#
1
SVM分类算法处理高维数据具有较大优势,但其未考虑语义的相似性度量问题,而LDA主题模型可以解决传统的文本分类中相似性度量和主题单一性问题。为了充分结合SVM和LDA算法的优势并提高分类精确度,提出了一种新的LDA-wSVM高效分类算法模型。利用LDA主题模型进行建模和特征选择,确定主题数和隐主题—文本矩阵;在经典权重计算方法上作改进,考虑各特征项与类别的关联度,设计了一种新的权重计算方法;在特征词空间上使用这种基于权重计算的wSVM分类器进行分类。实验基于R软件平台对搜狗实验室的新闻文本集进行分类,得到了宏平均值为0.943的高精确度分类结果。实验结果表明,提出的LDA-wSVM模型在文本自动分类中具有很好的优越性能。
1
利用smtp协议,使用python的smtplib,pyqt5模块开发的一个自动登录qq邮箱实现发送文本及文件邮件的程序源代码。
2023-03-02 16:34:37 75.46MB pyqt5 smtp python
1