基于N-Gram和TF-IDF的URL特征提取系统的研究与实现,葛峰,罗守山,针对web的日志分析通常会对URL进行特征提取,由于URL中可能包含未解码参数,直接使用传统特征提取算法对其进行特征提取会造成提取出
2022-03-13 10:17:23 791KB 首发论文
1
封装了枚举当前SD,TF卡片设备接口,同时封装了PCSC设备接口,接口封装层次分明。 示例代码如下 //DWORD dwRet = 0; HANDLE hFile = 0; WIN32_FIND_DATA stLFD = {0}; DWORD dwSumCount = 0; TCHAR athParsePath[MAX_PATH] = {0}; do { if(hFile == 0) { hFile = FindFirstFile(_T("\\*"),&stLFD); if(hFile == INVALID_HANDLE_VALUE ) { return ERROR_NO_DEVICE; } } else { memset(&stLFD,0,sizeof(stLFD)); if(!FindNextFile(hFile,&stLFD) || hFile == 0) { break; } } if(stLFD.dwFileAttributes != (FILE_ATTRIBUTE_TEMPORARY | FILE_ATTRIBUTE_DIRECTORY)) { continue; } memset(athParsePath,0,sizeof(athParsePath)); _stprintf(athParsePath,_T("\\%s\\Vol:"),stLFD.cFileName); #if defined(TYKEY_S9CI_UPDATE_FLAG) && defined(TYKEY_INCOMM_UPDATE_FLAG) if(TYKEY_S9CI_UPDATE_FLAG < TYKEY_INCOMM_UPDATE_FLAG) { if( UpdateTfTokenByPath(athParsePath,CTokenBase::TT_TF_S9CI) || UpdateTfTokenByPath(athParsePath,CTokenBase::TT_TF_INCOMM)) {} } else { if( UpdateTfTokenByPath(athParsePath,CTokenBase::TT_TF_INCOMM) || UpdateTfTokenByPath(athParsePath,CTokenBase::TT_TF_S9CI)) {} } #else #ifdef TYKEY_S9CI_UPDATE_FLAG UpdateTfTokenByPath(athParsePath,CTokenBase::TT_TF_S9CI); #endif #ifdef TYKEY_INCOMM_UPDATE_FLAG UpdateTfTokenByPath(athParsePath,CTokenBase::TT_TF_INCOMM); #endif #endif } while(1); if(hFile) { FindClose(hFile); }
1
指标 此仓库包含有关IS和FID分数的信息/实现(PyTorch,Tensorflow)。 这是一个方便的工具箱,您可以轻松地将其添加到项目中。 TF实施旨在计算与官方报告中报告的输出完全相同的输出。 讨论/公关/问题非常受欢迎。 用法 将此metrics/文件夹放入您的项目中,并参见下文(Pytorch),以及每个.py的标题注释以供使用。 我们还需要在下载一些文件,有关更多详细信息,请参见 。 TF的实现(几乎与官方相同,只是更改了界面,可以在论文中进行报告) :初始分数 分数 :计算统计信息(mu,sigma) Pytorch实施(无法在论文中提供报告,但可以快速浏览) 要求 pytorch,torchvision,scipy,numpy,tqdm 起始分数,当n_split = 10时,对于CIFAR-10火车数据的mean=9.67278, std=0.149
2022-03-10 10:17:21 37.99MB api commandline is metrics
1
主要为大家详细介绍了TF-IDF与余弦相似性的应用,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
2022-03-09 19:06:23 222KB TF IDF 余弦 关键词
1
伯特分类服务 介绍 使用训练分类模型并通过部署模型。 然后,我们可以使用REST API进行在线预测。 开始使用 整个实验基于Chnsenticorp数据集,该数据集是正面和负面情绪的两类数据集。 0.准备训练前模型 下载中文bert模型chinese_L-12_H-768_A-12 ,然后解压缩并移至models目录。 1.训练模型 sh fine-tuning.sh 2.进行预测和导出模型 我们需要将检查点更改为张量流服务的格式。 sh export-model.sh 然后, export-model的结构将为: . └── 1569141360 ├── saved_model.pb └── variables ├── variables.data-00000-of-00001 └── variables.index 3.部署模型
1
简单搜索引擎的设计与实现,该搜索引擎可以搜索c:\documents\下从00.txt-31.txt的32个英文txt文件,采用空格作为分词技术,没有去掉虚词。-s为远程搜索,-l为本地搜索,远程搜索请确保系统安装了IIS并把32个文本文件按原名(00.txt-31.txt)放到c:\wwwroot下。 只是一个做着玩的小东西,用来体会一下TFIDF算法而已。 havefun.c0de4fun
2022-03-05 08:31:30 10.47MB 搜索引擎 TF IDF Search
1
kNN(k-nearest neighbors algorithm) 此专案以新闻分类进行kNN范例之实作 kNN Introduction: 最近鄰居法(KNN演算法,又譯K-近鄰演算法)是一種用於分類和回歸的無母數統計方法,KNN常用來做資料分類。 KNN是一種監督式學習(Supervised Learning),監督式學習需透過資料訓練出一個model,但KNN沒有做training的動作。 K為使用者自己定義的常數,KNN就是選擇離自己最近的K的鄰居(Data),之後觀察哪一種類別(Tag)的鄰居最多就將自己也當成該類別。 Input: 测试文章: 1.使用ETtoday新聞作為訓練集分類。 2.使用Jieba作為分詞,取出Top 100 Words 作為每篇文章的關鍵詞。 3.取出k=3個最近鄰居作為分類依據,此外對最近的第一個鄰居作為加權*2 Output:
2022-03-04 15:56:12 605KB news tf-idf cosine-similarity knn
1
LED驱动TF-A3控制软件下载.rar
2022-03-01 15:45:33 879KB LEd
1
tensorflow serving部署单模型,多模型,热更新,BERT部署
2022-03-01 11:15:51 945KB nlp bert tf-serving tensorflow模型部署
1
利用TF-IDF策略的中文文本分类算法比较,刘昕玥,王敬,本文基于TF-IDF特征选取方法,分别使用朴素贝叶斯、随机森林与支持向量机算法对中文文本语料库进行分类实验。实验表明,支持向量机
2022-02-24 20:56:18 538KB 首发论文
1