从url中找到域名,首先想到的是用正则,然后寻找相应的类库。用正则解析有很多不完备的地方,url中有域名,域名后缀一直在不断增加等。通过google查到几种方法,一种是用Python中自带的模块和正则相结合来解析域名,另一种是使第三方用写好的解析模块直接解析出域名。
要解析的url
复制代码 代码如下:
urls = [“http://meiwen.me/src/index.html”,
“http://1000chi.com/game/index.html”,
“http://see.xidian.edu.cn/cpp/html/1429.html”,
1