中文人名语料库(Chinese-Names-Corpus) 业余项目“萌名NameMoe(一个基于语料库技术的取名工具)”的副产品。 萌名手机网页测试版: ,欢迎体验。 不定期更新。只删词,不加词。 可用于中文分词、人名识别。 请勿将本库打包上传其他网站挣积分,已上传的请配合删除,谢谢! 中文常见人名(Chinese_Names_Corpus) 数据大小:120万。 语料来源:从亿级人名语料中提取。 数据清洗:已清洗,但仍存有少量badcase。 新增人名生成器。 中文古代人名(Ancient_Names_Corpus) 数据大小:25万。 语料来源:多个人名词典汇总。 数据清洗:已清洗。 中文姓氏(Chinese_Family_Name) 数据大小:1千。 语料来源:从亿级人名语料中提取。 数据清洗:已清洗。 中文称呼(Chinese_Relationship) 数据大小:5千,称呼词根
2023-02-23 16:26:55 17.62MB corpus names dataset dict
1
从视频中识别、裁剪和保存人脸作为图像 有关技术细节,请查看相关! 如果您需要具有超高精度的专业人脸检测和识别项目,请联系。 快速演示 人脸正在跟踪、裁剪和保存为视频中的图像 从具有适当路径层次结构的视频中保存图像 理论 如果您想研究面部识别或面部检测的某些方面。 您想要的一件事是可用于您的系统的各种面Kong。 您可以通过此程序创建自己的人脸检测/识别数据库。 从视频中识别人脸,裁剪并将它们保存为适当路径层次结构下的图像。 一旦我们获得了人脸数据,我们就需要在我们的程序中读取它。 在演示应用程序中,我决定从一个非常简单的 CSV 文件中读取图像。 为什么? 因为这是我能想到的最简单的独立于平台的方法。 但是,如果您知道更简单的解决方案,请与我联系。 基本上所有 CSV 文件需要包含由文件名后跟 ; 组成的行。 后跟标签(作为整数),组成如下一行: /path/to/image.e
1
DataSet读取XML,在GridView中显示XML的内容。 环境: WIN XP VS2008
2023-02-22 16:25:51 36KB XML DataSet
1
CLUE Emotion Analysis Dataset 情感分析数据集
2023-02-20 18:33:48 4.56MB 大数据 情感分析
1
该数据包含世界银行自1961年以来发布的一些世界统计数据 data.csv
2023-02-18 15:32:15 2.71MB 数据集
1
最全DataSet用法详细,内容包括dataset的详细用法。
2023-02-13 12:31:02 110KB 最全DataSet用法详细
1
Kaggle-SMS-Spam-Collection-Dataset-:使用NLTK和Scikit-learn分类为垃圾邮件或火腿邮件
1
手写数学符号数据集 该数据集来自。原始数据以SQL形式提供。我已经将每条记录转换为32x32的numpy数组,可以在找到。 我还对模型训练做了一些处理(转换为float32 ,添加通道维数,规范化,将类数限制为500),并上传。 细节 实例数:210454(原始)/ 195244(已处理)。 图片尺寸:32x32。 类数:1098(原始),/ 500(已处理)。
2023-01-31 17:05:10 292KB Python
1
Yelp分析和评级预测 概述 Yelp是一个带有社交网络工具的区域目录平台和审阅网站。 该网站提供了针对本地企业(水疗中心,餐厅,百货公司,酒吧,本地本地服务,商店,汽车)的众包评论。 这有助于用户进行业务评级和评论。 通常,评论是由几百行左右的单词组成的简短文本,描述了各个方面的各种用户体验。 这为企业所有者提供了改进产品的机会,并使客户可以选择最佳的行业。 商业价值/分析目标 管理层可能没有足够的时间来进行每一次审核。 如果可以一目了然地向他们提供有价值的信息和见解,那将是非常有用和节省时间的。 不仅对于管理人员,而且对于试图了解更多餐厅信息并需要一些帮助来订购或选择餐厅的客户,也是如此。 毕竟,在当今世界,每个人都喜欢在做出决定之前先阅读评论和反馈。 在我们的项目中,我们使用自然语言处理和机器学习来实现这些业务和客户目标。 我们专注于情感分析,主题建模,数据分析和评级预测的分类。 数
2023-01-29 20:44:46 2.59MB nlp machine-learning text-analytics yelp-dataset
1
垃圾邮件分类---安然数据集 使用逻辑回归和计数向量化将Enron数据集的电子邮件分为垃圾邮件或火腿邮件。 注意:彻底评论了Jupyter / IPython笔记本,因此这里不需要广泛的自述文件。
2023-01-25 17:31:14 30.69MB
1