上传者: 42110362
|
上传时间: 2022-02-24 02:14:53
|
文件大小: 9.36MB
|
文件类型: -
清理和分析Office(US)脚本的模块
如何使用
在根文件夹中,运行
python -m run
将加载,分析脚本并将关键统计信息保存到data / processed /文件夹中。
过程
首先加载数据,然后将情节名称从第二个数据集( process_script.py )添加到原始表中
然后,将每一行分解为令牌,并对单词进行计数( breakdown_line.py )
处理每一行以提取其情感得分和提及的字符( analyze_line.py )
经处理的和anaylzed线被保存processed_script.csv
最后,字数和行数汇总到多个文件中,并且一个主表保存在all_counts.csv下