xslt, xml, xpath, xml transformation, DOM, SAX
2022-01-03 12:45:34 11.08MB xslt xml xpath xml
1
包含了xpath的jar包,有jaxen-1.1-beat-6、jaxen-1.1-beat-7、jaxen-1.1-beat-11和jaxen-1.1.6,共4个
2021-12-24 22:30:15 811KB xpath jaxen jar包
1
chrome浏览器下解析html十分好用的扩展工具,可以方便的检测xpath语法是否正确,在爬虫解析时十分有用
1
Fire-IEBrowser1.4.7z是一个IE找xpath工具,使用方法为:用excel打开Fire-IEBrowser1.4.xlsm启用宏,点击proceed 按钮。
2021-12-19 02:02:30 104KB xpath IE selenium
1
前言 这两天原本想在淘宝上爬点东西进行分析的,但没想到淘宝的反爬机制对我这个爬虫菜鸡充满了恶意。先是被数据的格式搞得焦头烂额,好不容易写好了测试一页的代码,准备美滋滋开始大显身手,爬取多页时,发现竟然被封IP了!呜呜┭┮﹏┭┮。于是,开始研究各种反反爬的机制,IP代理,多线程、模拟登陆… …发现自己的盲区越来越大。眼瞅着与自己的博客更新计划越行越远,只好先换个目标,对某东下手。但并不代表我会放过它,等自己在修炼一段时间,再来会会它。下面,我们开始进入正题吧。 这次想做一个关于糖果的分析,于是爬取了京东共2700左右条的数据,这个数据应该是够自己分析了。京东比较坑的一点是,他的每一页是先加载一部
2021-12-03 10:01:05 530KB le ni niu
1
java写的xpath生成工具
2021-11-29 12:30:34 1.71MB java xpath 生成 工具
1
最近,我朋友说我做的爬虫不行,比如那个爬取全站的小说,你无法指定,他只会一直的爬,他们说爬下来的小说都不是他们想要的,我就想,能不能搞一个智能爬虫,只要你输入想要的小说,它就自动给你搜索,然后把符合条件的几本小说的详细信息给你,然后让你自己选择. 确定了思路后,话不多说,直接刚上去。 要搞智能爬虫,首先该搞的,就是搜索功能,当然,凭我自己是不可能搞出来的,得借助网站!] 正在想的时候呢,却发现笔趣阁自带搜索功能!天助我也! 诶,规律是如此简单,那不就可以了吗,直接询问要查的小说,然后拼接URL啊 话不多说,上代码 def workOn(self): init(auto
2021-11-28 14:34:09 1.08MB input web技术 xpath
1
自己写的XmlUtils.java; 1.可以根据传入的xpath,生成xml,例如:a/b/c : 2.可以将指定xml字符串添加指定节点 3.xmldocument2String 4.支持属性操作 看到网上几乎没有这样的例子,贡献一下,中国的软件太需要贡献了。
2021-11-25 10:17:20 14KB xpath java
1
问题现象 元素的属性中没有id、name;虽然有class,但比较大众化,且位置也不固定;例如:页码中的下一页;那该如何找到该元素? 上一页 1 2 下一页 解决办法 text() text() 函数文本定位 page_next = driver.find_element(By.XPATH, '//a[text()=下一页)]') contain() contains 匹配一个属性值中
2021-11-20 21:54:45 30KB le ni niu
1
这是xml课程实验,查找所有最外层的section元素(假设仅知道section元素能够无限嵌套,但并不确定最外层的section出现在文档的什么层次上,也就是说:不要简单地使用/book/section)
2021-11-19 08:36:26 943B XPath xml课程实验
1