1、导包
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
2、log日志读取
简单分析日志文件,查看日志的数据结构,主要是分隔方法,发现是以\t分隔的
df = pd.read_csv(’./log.txt’, header = None, sep = ‘\t’)
df.head() #查看前5条数据
log日志没有标题行,所以header为空,sep是分隔符的类型
3、数据优化
3.1、查看内存占用
log日志中记录了大量数据,并不是都有用,无用的数据会占用内存,降低运行效率。
使用df.info
2022-03-03 10:43:08
247KB
AND
AS
li
1