开源web知识图谱项目 爬取百度百科中文页面 解析三元组和网页内容 建立中文知识图谱 建立百科bot(重建中) 更新20200720 Windows上的部署参考,感谢LMY-nlp0701! 更新20191121 迁移代码到爬虫框架scrapy 优化了抽取部分代码 数据持久化迁移到mongodb 修复chatbot失败问题 开放neo4j后台界面,可以查看知识图谱成型效果 提示 如果是项目问题,请提问题。 如果涉及到不方便公开的,请发邮件。 ChatBot请访问 成型的百科知识图谱访问,用户名:neo4j,密码:123。效果如下: 环境 python 3.6 re:url正则匹配 scrapy:网页爬虫和网页解析 neo4j:知识图谱图数据库,安装可以参考 pip install neo4j-driver:neo4j python驱动 pip install pymongodb:mongodb的python支持 mongodb数据库:安装参考 代码执行: cd WEB_KG/baike scrapy crawl baike 执行界面(按ctrl + c停止): 知识图谱效果图
2021-11-29 15:47:30 1.45MB nlp spider neo4j wiki
1
仿百度百科网站程序源码是专为中文用户设计和开发,程序源代码100%完全开放的一个采用 PHP 和 MySQL 数据库构建的高效的中文百科建站解决方案,在尊重版权的前提下能极大的满足站长对于网站程序进行二次开发。
2021-11-22 19:05:06 4.11MB 百度 百科 网站 程序
1
百科在线编辑器,是从百度百科词条那里挖下来的,支持图上上传,保持原有的简洁风格,清新自然,功能也同样简洁,但是并不是把有用功能去掉了,相反,编辑器支持图片上传、表格插入、链接插入、临时保存、插入特殊字符、撤销和恢复等功能,从界面看很简单,但是功能不要小看哦,再说也是门户网站里的东西哦。插入上传采用PHP,因此为确保演示功能都正常,请勿必在PHP下测试运行。
2021-11-19 19:40:26 90KB 脚本资源-在线编辑器
1
python写的百度百科爬虫
2021-11-01 21:37:23 42KB 爬虫
1
自己实现的百度百科爬虫,非框架,可运行,可用于新手学习入门,通过此项目可清晰了解爬虫实现的基本原理
2021-10-03 16:47:47 25KB 爬虫,python
1
python3爬取1000个百度百科页面源码,带有详细注释。
2021-10-03 16:05:45 5KB python爬虫
1
#2.4_小练习__爬百度百科_(爬虫_scraping_基础教学_教程_Tutorial)
2021-09-01 21:00:05 28.16MB 学习资源
百科一下,你就知道,来自百度百科官方,让人类更好地认知世界! 1.支持划词查询百度百科 2.支持右键查询百度百科 3.支持快速查找百度百科 4.支持精简状态看百科词条 支持语言:中文 (简体)
2021-08-31 12:31:18 87KB 搜索工具
1
雪亮工程_百度百科.mht
2021-08-29 13:06:23 3.14MB 道路交通
百度百科、淘宝量子等值得一读的架构图。如果你也在设计架构,就参考一下呗!
2021-08-23 12:08:54 463KB 架构图
1