上传者: 38592405
|
上传时间: 2022-04-29 22:55:37
|
文件大小: 119KB
|
文件类型: PDF
import requests
import re
import json
import os
session = requests.session()
def fetch_url(url):
return session.get(url).content.decode('gbk')
def get_doc_id(url):
return re.findall('view/(.*).html', url)[0]
def parse_type(content):
return re.findall(rdocType.*?\:.*?\'(.*?)\'\,, content)[0]
def