在采集美女站时,需要对关键词进行分词,最终采用的是python的结巴分词方法。 中文分词是中文文本处理的一个基础性工作,结巴分词利用进行中文分词。 其基本实现原理有三点: 1.基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG) 2.采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合 3.对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法 安装(Linux环境) 下载工具包,解压后进入目录下,运行:python setup.py install 模式 1.默认模式,试图将句子最精确地切开,适合文本分析 2.全模式,
2021-12-04 17:32:23 70KB jieba python python
1
Web Api使用详解(全部实例讲解,可直接运行看效果).rar Web Api使用详解(全部实例讲解,可直接运行看效果).rar
2021-12-02 15:43:42 58.02MB c#
1
PHP 表单验证 提示:在处理 PHP 表单时请重视安全性! 这些页面将展示如何安全地处理 PHP 表单。对 HTML 表单数据进行适当的验证对于防范黑客和垃圾邮件很重要! 我们稍后使用的 HTML 表单包含多种输入字段:必需和可选的文本字段、单选按钮以及提交按钮: 上面的表单使用如下验证规则: 字段 验证规则 Name 必需。必须包含字母和空格。 E-mail 必需。必须包含有效的电子邮件地址(包含 @ 和 .)。 Website 可选。如果选填,则必须包含有效的 URL。 Comment 可选。多行输入字段(文本框)。 Gender 必需。必须选择一项。
2021-12-01 19:29:36 126KB html代码 php php框架
1
基于OpenCV2.4.8和 python 2.7实现简单的手势识别。 以下为基本步骤 1.去除背景,提取手的轮廓 2. RGB->YUV,同时计算直方图 3.进行形态学滤波,提取感兴趣的区域 4.找到二值化的图像轮廓 5.找到最大的手型轮廓 6.找到手型轮廓的凸包 7.标记手指和手掌 8.把提取的特征点和手势字典中的进行比对,然后判断手势和形状 提取手的轮廓 cv2.findContours() 找到最大凸包cv2.convexHull(),然后找到手掌和手指的相对位置,定位手型的轮廓和关键点,包括手掌的中心,手指的相对位置 特征字典主要包括以下几个方面:名字,手掌中心点,手掌的直径,
2021-11-27 21:40:54 106KB opencv python 手势
1
本文给大家分享的是一个java纯数字加密解密技术,加密和解密本身就是一对共生体,缺一不可,需要的朋友可以参考下
2021-11-25 09:47:14 55KB Java 加密 解密
1
人工智能课程项目报告 基于 Alpha-Beta 算法的五子棋游戏 班级学号姓名 摘要 博弈是人工智能的主要研究领域之一 而五子棋是经典的双 agent 博弈游戏 本文对针对五子 棋游戏的 Alpha-Beta 搜索算法进行研究设计实际算法并使用 Java 完成程序设计实现人机博弈 为了提高算法效率在传统的 Alpha-Beta 算法的基础上根据五子棋的特点通过局部搜索优先 值启发搜索限制广度等
2021-11-24 23:37:38 258KB 文档 互联网 资源
python提供一个库 xlwt ,可以将一些数据 写入excel表格中,十分的方便。贴使用事例如下。 #引入xlwt模块(提前pip下载好) import xlwt #使用workbook方法,创建一个新的工作簿 book = xlwt.Workbook(encoding='utf-8',style_compression=0) #添加一个sheet,名字为mysheet,参数overwrite就是说可不可以重复写入值,就是当单元格已经非空,你还要写入 sheet = book.add_sheet('mysheet',cell_overwrite_ok=True) #接着就是给指定的单
2021-11-24 17:04:51 36KB c ce ex
1
实际的项目,存在多张表的关联关系。不可能在一张表里面就能检索出所有数据。如果没有表连接的话,那么我们就需要非常多的操作。比如需要从A表找出限制性的条件来从B表中检索数据。不但需要分多表来操作,而且效率也不高。比如书中的例子: 代码如下: SELECT FId FROM T_Customer WHERE FName='MIKE' 这个SQL语句返回2,也就是姓名为MIKE 的客户的FId值为2,这样就可以到T_Order中检索FCustomerId等于2 的记录: 代码如下: SELECT FNumber,FPrice FROM T_Order WHERE FCustomerId=2 下面
2021-11-23 10:19:44 55KB mysql mysql数据库 select
1
MATLAB遗传算法工具箱函数及实例详解,里面含有代码。
2021-11-20 14:32:33 77KB 遗传算法
1
利用numpy库 (缺点:有缺失值就无法读取) 读: import numpy my_matrix = numpy.loadtxt(open("1.csv","rb"),delimiter=",",skiprows=0) 写: numpy.savetxt('2.csv', my_matrix, delimiter = ',') 可能遇到的问题: SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 原因是文件路径名中含有转义字符,将路径中的\换成\即可。 利用pandas库 读
2021-11-19 18:04:20 36KB c csv csv文件
1