给大家带来一款功能强大的批量文本提取器,该软件非常不错,当前支持支持正则表达式,批量提取文本,可以将HTML等文件中指定内容存入数据库、HTML、文本文件,存入数据库的意思是将提取的文本内容直接导入进数据库中。
批量文本提取器功能:
提供多种查找、获取信息的方式:
提取文件中全部email邮件地址
提取文件中全部互联网址(无参数)
提取文件中全部互联网址(带参数)
提取HTML文件中body的文本内容
提取HTML文件中title和body的文本内容
提取HTML文件中textarea的文本内容
提取HTML网页的显示文本内容
提取DOC/RTF等文件中全部文本内容
提取DOC/RTF等文件中全部文本内容(自动分析标题)
并可自定义正则表达式获取信息
支持从其它网站直接提取文本内容,生成所需数据库文件
支持GB2312/UTF-8多种编码
可将提取信息生成文本文件、HTM网页文件、MDB数据库文件
可设置提取文件的间隔,免除下载网页过快,服务器不响应
1