DOCX,XLSX和PPTX文件是通常压缩的大多数XML子文件的集合。 该程序首先尝试修复任何基于zip的损坏。 从那里开始,它进行了四种不同的算法尝试进行修复或恢复。 对于使用验证的第一种方法,将查找第一个XML错误的位置。 此时,子文件将被截断并修复。 第二种方法以相同的方式工作,只是XML验证比较宽松。 使用第三种方法,将返回严格的XML验证,并像以前一样截断和修复损坏的XML子文件,但是,从相应正确扩展名的空白完整健康docx,xlsx或pptx引入丢失的XML子文件。 第四种方法使用SilverCoder的DocToText来挽救文本或数据,然后将文件作为包含裸露的已恢复文本或数据的旧式MS Office 97-2003格式文件打开。 有关恢复损坏的MS和Open Office文件的其他方法,请参见Sourceforge上的其他项目。
2021-10-12 10:15:20
55.4MB
开源软件
1