表格检测和表格提取
功能:
检测表单页面中的所有表格。
在它周围创建边界框。
将其分割并提取表格的单元格。
脚步:
灰度图像
二进制阈值
使用垂直内核和cv2.getStructuringElement获取所有垂直线
同样,使用水平内核和cv2getStructuringElement获取所有水平线
使用cv2.addWeighted组合所有水平线和垂直线
执行一些形态变换,如cv2.erode以获得清晰的线条和更好的结果。
查找轮廓并提取矩形/表格单元格。
先决条件
Python v3.6
OpenCV v3.4 import cv2
Numpy v1.16 import numpy as np
操作系统import os
1