上传者: 38718415
|
上传时间: 2021-04-23 16:17:26
|
文件大小: 32KB
|
文件类型: PDF
使用场景:需要去除txt文本中的空格、数字、特定字母等。
需要修改的txt文本叫做:train.txt
修改之后保存成:train_output.txt
# ecoding=utf-8
ifn = r"train.txt"
ofn = r"train_output.txt"
infile = open(ifn,'rb')
outfile = open(ofn,'wb')
for eachline in infile.readlines():
#去掉文本行里面的空格、\t、数字(其他有要去除的也可以放到' \t1234567890'里面)
lines = filter(lambda c