反爬技术方案的研究与落地 一个在线教育的平台,译文的数据很重要吧,但被别人通过爬虫技术全部爬走了,那结果就是“凉凉”。再比说有个独立开发者想抄袭你的产品,通过抓包和爬虫手段将你核心的数据拿走,然后短期内做个网站和App,短期内成为你的劲敌。成果:segmentfault上发表过,获胜赞148。 大前端时代安全性如何做 如果想了解大前端(Web,App,接口)区域的安全性,可以查看我的介绍。 爬虫工程师的爬虫手段 从渲染好的html页面直接找到感兴趣的副本,然后获取对应的文本 去分析对应的接口数据,更加方便,精确地获取数据 制定出网站端反爬技术方案 本人从这2个角度(网页所见非所得,查接口请求没用)出发,制定了下面的反爬方案。 使用HTTPS协议 单位暂停限制掉请求次数过多,则封锁该账号 前端技术限制(接下来是核心技术) 例如需要正确显示的数据为“ 19950220” 先按照自己的需求利用相应的规则(数字乱序映射,正常正常的0对应还是0,但是乱序就是0 <-> 1,1 <-> 9,3 <-> 8,...)制作自定义字体(ttf) 根据上面的乱序映射规律,求得到需要返回的数据1995022
2024-01-18 15:21:14 44.04MB nodejs algorithm ocr encryption
1
tesseract-ocr-3.01安装包很多下载链接都是谷歌的,很多人下不了。手头上刚好有资源就跟大家共享一下。
2024-01-11 11:49:31 3.74MB tesseract OCR
1
Tesseract(DLL)
2024-01-11 11:47:32 598KB OCR
1
C# PaddleInference OCR识别 学习研究Demo,完整Demo,可直接运行 VS2022+.net4.8+ OpenCvSharp4+Sdcb.PaddleInference https://blog.csdn.net/lw112190/article/details/131554433 //读自己加密后的模型文件,解密后写入byte[] byte[] programBuffer = new byte[Length]; byte[] paramsBuffer = new byte[Length]; fixed (byte* pprogram = programBuffer) fixed (byte* pparams = paramsBuffer) { PaddleNative.PD_ConfigSetModelBuffer(det_ptr, (IntPtr)pprogram, programBuffer.Length, (IntPtr)pparams, paramsBuffer.Length); }
2024-01-03 13:10:38 180.85MB
建议放到tessdata目录下使用,针对java操作pdf、png、jpg等图片上文字的OCR识别所需要的语言库。
2023-12-22 17:14:10 18.51MB java OCR PDF
1
文字识别网站极大地提高了工作效率,不再需要费时费力地手工输入大量文字,只需将文件拍照后上传至网站,自动识别并转换即可。这种快速、准确的转换过程不仅节省了宝贵的时间,还大大降低了出错的风险。
2023-12-16 10:25:18 300B
1
根据网上VBA OneNote2013 OCR图像识别代码改编,非原创,修改部分错误用vb6win7x64下完美运行。
2023-12-15 19:08:19 114KB OneNote2013 office
1
OCR 智能著录平台,主要面向档案数字化加工行业,为用户提供快速著 录以及智能著录功能,平台支持数据检索、数据统计、OCR 智能识别、自定 义识别、批量识别、文件自动分件等应用需求。 设备建议配置 a) 处理器:Intel(R) Core(TM) i5 及以上( 最低设备配置要求:4 核 4 线程及以上) b) 内存:4GB 及以上 c) 系统:window 10 d) 软件运行环境:.net4.8(64x)
2023-12-07 14:27:06 261.77MB
1
Python构建快速高效的中文文字识别OCR
2023-12-07 08:46:49 44KB python
1
tesseract的编译文件,可用于qt在windows上进行开发
2023-11-28 19:08:28 39.32MB ocr
1