知网 * 通过发送解析包形式抓取数据,相比于使用selenium等方式性能稍高一些。 * 可使用知网高级检索功能进行搜索,更高效检索文献。 * 可根据网络及知网反爬虫情况选择性开启详细信息抓取及下载caj文献功能。 * 利用excel表格快速查看所需文献摘要等信息,可根据excel提供下载链接选择性下载,防止下载过快导致知网反爬。 # 使用方法 ## 安装依赖 >在验证码处理部分使用了`tesserocr`,不过验证效果目前不是很好,所以默认开启手动识别验证码。 > >如果本地没有安装`tesseract`,可以先安装这个,再执行`pip install tesserocr`。或者将`CrackVerifyCode.py`文件第15、63、64行注释后再执行安装命令。 ```shell pip install -r requirements.txt ```
2024-04-10 11:33:29 19KB 爬虫
1
本项目使用 GPT2-Chinese 的模型将wiki中文的数据导入模型训练了通用模型。 将GPT2-chitchat的对话任务稍作修改来适用于中文摘要任务。 将通用模型的权重应用在摘要问题上进行进一步训练的。 GPT2-Chinese 参考:https://github.com/Morizeyao/GPT2-Chinese GPT2-chitchat参考:https://link.zhihu.com/?target=https%3A//github.com/yangjianxin1/GPT2-chitchat 项目工作流程详见:https://zhuanlan.zhihu.com/p/113869509 本项目为GPT2-chitchat稍作修改的内容,在此也感谢大佬的分享。 由于NLPCC的摘要数据为新闻语料,涉及话题和内容较多,应用在垂直领域下效果会好一些。
2024-04-07 20:01:34 482KB gpt2 智能写作 NLP 自然语言处理
1
基于深度学习的文本摘要自动生成(自然语言处理)-本科毕业设计,详细代码,过程可见博客
1
NLP-study 记录做过的NLP任务,包含但不限于文本分类,关系分类,命名实体识别,文本摘要,文本生成等,基于tensorflow2.0或者pytorch框架。
2024-01-12 21:57:28 83.48MB Python
1
PHP截取字符串,生成文章摘要,非常好用的代码,一看就会用,节省你大量开发时间!
2023-10-30 09:07:33 5KB php 截取字符 摘要
1
信息论语编码课程笔记,信道编码、信源编码、香农定义
2023-06-27 09:19:31 9KB 信息论与编码
1
据统计,目前全国已有4万家商业网站,其中网上商店700余家。电子商务项目大量推出,几乎每天都有各类电子商务咨询网站、网上商店、网上商城、网上专卖店、网上拍卖等诞生。电子商务应用与发展地域也由北京、上海、深圳等极少数城市,开始向各大中城市发展。可以说,中国电子商务已经由表及里、从虚到实,从宣传、启蒙和推广阶段进入到了务实的发展实施阶段。 但是,目前我国“商务为本”观念依然薄弱。企业和消费者电子商务意识有待加强。怎样将Internet和中国国情结合,充分发挥电子商务的优越性,实现极富有意义的电子商务技术和商务模式的创新,是摆在中国电子商务业界人士面前的一大课题。 当中,网上书店在我国已有几年的时间,虽然从数量上讲有了一定的发展,但目前国内尚无一家在网上零售领域形成领先优势的网上书店。造成这种局面的原因是多方面的,既有社会的原因,也有书店自身的原因。 从网上书店自身来看,目前还存在不少问题,主要表现为:主页信息量小,内容和形式缺乏吸引力,更新不够及时;未能对图书馆市场进行有效细分,服务方式比较单一;分类体系不尽合理,图书分类查询系统尚需完善;营销方式不够灵活。 虽然网上书店因为各种原因目
2023-04-20 19:35:32 1.43MB 毕业设计 java sql 范文/模板/素材
1
字符集转换(GBK、UTF-8)、编码转换(二进制、十六进制字符串、BASE64字符串)、摘要(MD5、SHA128、SHA256、SM3)、对称加解密(IDEA、SM4)
2023-04-07 15:51:35 4.28MB 编码转换 对称加解密 字符转换 摘要
1
提取与抽象文本摘要方法:分析 文本摘要解决了将信息压缩为更紧凑形式的问题,同时又将重要信息保留在文本中。 自动文本摘要的方法分为两个主要类别:提取性和抽象性。 提取摘要的常见方法包括根据句子的相关性,选择最能代表原始文本表达信息的最具代表性的句子。 一种流行的抽象文本摘要方法是使用编码器-解码器结构,该结构会生成数据的潜在因子表示形式,并将其解码以生成摘要。 该项目的目的是分析和比较两种方法在专门用于科学文献时的有效性。 动机 我从事此项目的动力来自个人经验。 作为一名大学学生,我经常会遇到大量与我的兴趣相关的科学论文和研究文章,但我没有时间阅读所有内容。 我希望有一种方法能够对论文的主要思想进行汇总,而又不会显着减少重要内容。 文本摘要是一种广泛实施的算法,但是我想探索特别适用于科学写作的不同文本摘要方法。 介绍 自动文本摘要是使用信息优先级排序系统缩短文本文档的过程。 生成摘要的技术会
2023-04-06 16:24:21 1.85MB JupyterNotebook
1
jsp+sql网络书店销售管理系统(论文+任务书+开题报告+中期检查表+摘要+英文文献)
2023-03-15 15:33:52 1.42MB jsp+sql网络书店销售管理系
1