从网络收集财务数据
从ju-chao网站收集财务数据并可以从中下载pdf文件的python脚本,更重要的是它可以使用pdfplumber从pdf文件中解析您想要的数据。
平台:
win10 anaconda python3.7 pdfplumber == 0.5.12
(如果您已经安装了pdfplumber,请不要安装pdfminer,因为pdfplumber使用pdfminer的另一个版本作为后端,它会破坏环境)
original_data dir :准备进行测试的测试文件,您可以通过修改.py文件中的文件路径来使用它们
download_files目录:下载目录,用于保存来自网络的下载文件
output_files dir:输出文件的目录,您可以在此处找到在.py文件中创建的文件
download_filesFromcsv_wyk.py可以根据.csv文件中的url链接从Web下载文
1