PHP 文章提取器 这是一个用于 PHP 的网络文章解析和语言检测库。 该库从网页读取文章内容,删除所有 HTML 并仅提供原始文本,适用于文本到语音或机器学习过程。 对于我开发的一个项目,我发现许多现有的开源解决方案很好的起点,但每个都有独特的失败。 该库将三种不同的方法聚合到一个解决方案中,同时添加了语言检测的附加功能。 如何使用 这个库是通过 packagist.org 分发的,所以你可以使用 composer 来检索依赖项 composer require crscheid/php-article-extractor 通过 URL 调用 该库将尝试为您检索 HTML。 您只需创建一个 ArticleExtractor 类并在其上调用parseURL函数,传入所需的 URL。 use Cscheide \ ArticleExtractor \ ArticleExtractor
2021-07-23 18:03:21 42KB php website extractor extraction
1
一个可以让你从容不迫的应对007,ADAT,APAK,MHW,MIX,MW4,NPAK,PACK,PAK,PBO,PFF,PKR,POD,RES,U,等等数十种文件包的解包/封包程序,程序可以在扫描过程中自动按选择的分类识别你需要的文件,有了它,几乎各种游戏的文件包你都可以解开并得到你想要的资源。汉化绿色版
2021-06-24 20:19:59 689KB Extractor
1
RAR Extractor Unarchiver是一款精致小巧的压缩工具,是专门针对Rar,Zip,Tar,7-zip,Gzip,Bzip2,XZ,Tar.gz,bz2,iso,pkg,swf,exe,jar,xip,dms等多种格式的压缩程序,您可以使用它方便地提取存档文件,进行解压缩操作,既快速又安全。
2021-06-23 12:00:47 10.11MB 压缩工具
1
DWTC-Extractor:用于常见爬网的 Web 表提取器 这是用于创建的完整提取器。 注意:这部分基于最初作为一部分发布的代码。 原始存储库可在找到。 修改包括: 删除不必要的代码片段并更新依赖项 将集成到原始提取代码中,以便能够处理使用 WARC 文件格式的较新版本的 Common Crawl。 这也意味着该提取器是基于 WARC 的新版 Common Crawl 上的任何提取任务的良好基础。 添加网络表格识别和提取代码(在“webreduce”包中) 另请注意,Web Data Commons 项目现在基于旧版本的 Common Crawl 发布。 此代码是在 WDC 语料库发布之前分叉的。 内容 运行提取器(原始文档) 以下是原作者对此代码的原始评论,必要时进行了编辑。 主脚本的文档大多仍然适用,或者经过编辑以与新版本的 CC 配合使用。 此实现使用 AWS 管道
2021-06-22 19:20:51 288KB Java
1
LinkExtractorWeb 要启动新的 Phoenix 应用程序: 使用mix deps.get安装依赖mix deps.get 使用mix phoenix.server启动 Phoenix 端点 现在您可以从浏览器访问localhost:4000 。
2021-06-22 11:04:58 49KB JavaScript
1
图片文件的文件元数据读取工具
2021-06-20 11:03:40 720KB metadata metadata-extract jpg
1
照片EXIF信息的读取和改写jar包带实例
2021-06-18 18:01:40 189KB 照片EXIF信息的读取和改写ja
1
处理exif图片信息 mediautil-1.0和metadata-extractor-2.3.1.jar mediautil-1.0 metadata-extractor-2.3.1.jar
1
stdf 转 换 工 具,把 数 据 从 STDF 中 提 取 为 EXCEL 数 据。
2021-06-12 19:31:23 577KB STDF Extractor Excel 测试
1
高斯白噪声matlab代码取证工具-混合G-PRNU提取器 这是基于Muammar的工作而进行的更新的更新的PRNU提取器(Lucas等),包括对本机PRNU提取器的定制 G-PRNU提取器与本机PRNU一起正在实现 定制不同尺寸和插值方法 李的增强技术。 (如果需要增强,请在lucasdigicamident.m中取消注释132-138行) 可用的过滤器: 高斯型 米哈克 西格玛 bm3d -REEPJYOTI DEKA,Eurecom, 先决条件: 图像处理工具箱是必需的。 如果将使用Mihcak图像去噪算法,则需要Matlab Wavelets Toolbox。 如果将使用BM3D去噪算法,则需要BM3D软件包。 可以从以下位置下载: 参考: Lukas,J.,Fridrich,J。和Goljan,M。“从传感器图案噪声中识别数码相机”。 IEEE信息取证与安全事务,2006,1,205-214 哈尼·穆玛(Muammar,Hani)。 使用图像传感器PRNU模式识别源摄像机。 伦敦:通信和信号处理研究小组,2014年。帝国理工学院通信和信号处理研究小组。 网络。 2016年2月
2021-06-10 16:24:58 34KB 系统开源
1