DocumentAnalysis Wikipedia document analysis using Hadoop Map的每个输入是XML文档的 标签到 标签。其中key没有意义,value就是这两个标签(包括标签本身)的值,可以通过 .toString() 方法转化为字符串进行下一步处理 src/documentParser TextParser.java 正则表达式处理String,能够去除大部分标点符号,需要补全 XMLHandler.java SAX流形式处理XML格式的字符串
2021-07-06 17:06:49 84KB Java
1
易读 自定义 JS/CSS 使维基百科页面更易于阅读。 如果您有注册的 Wikipedia 帐户,则可以通过将其复制到您的自定义 JS/CSS 文件来使用它。 请注意,这仅适用于默认的 Vector 皮肤——它需要对任何其他皮肤进行认真的调整。 ##安装 将 JS 文件的内容复制到您的。 将 CSS 文件的内容复制到您的 。 。
2021-07-03 18:03:37 2KB wikipedia CSS
1
一个简单的 Python 维基百科爬虫。 运行: celery worker -A crawler.tasks --loglevel=info -Q fetch_queue -n 'fetcher' celery worker -A crawler.tasks --loglevel=info -Q parse_queue -n 'parser' 用于监控:celery -A crawler.tasks 花 --broker=amqp://guest:guest@localhost:5672// --broker_api=http://guest:guest@localhost:15672/api/ rabbitmq-plugins 启用 rabbitmq_management 花: RabbitMQ: 为什么只有维基百科 => 几乎可以保证健全的 HTML
2021-06-29 19:23:50 4KB Python
1
I2C维基百科.pdf
2021-06-21 18:07:00 7.17MB I2C IIC
1
SPI维基百科.pdf
2021-06-21 18:07:00 5.32MB SPI
1
装起来有点儿复杂
2021-06-13 18:01:23 57.1MB wikipedia
1
定义什么是1型糖尿病以及病因、诊断、预防、治疗和管理等内容。
2021-06-12 19:02:06 2.21MB 1型糖尿病 维基百科
1
定义什么是2型糖尿病以及相关病因、诊断、筛查、预防和管理等内容。
2021-06-12 19:02:05 2.92MB 2型糖尿病 维基百科
1
核糖定义及其分子结构
2021-06-12 19:02:05 1.29MB 核糖 维基百科
1
定义核糖核酸(RNA),以及其分子结构,组成、合成与修饰、分类等内容。
2021-06-12 19:02:05 2.07MB 核糖核酸 RNA 维基百科
1