Python-模块-filecmp

filecmp模块用于比较文件及文件夹的内容,它是一个轻量级的工具,使用非常简单。python标准库还提供了difflib模块用于比较文件的内容。关于difflib模块,且听下回分解。

 

    filecmp定义了两个函数,用于方便地比较文件与文件夹:

 

filecmp.cmp(f1, f2[, shallow])

 

    比较两个文件的内容是否匹配。参数f1, f2指定要比较的文件的路径。可选参数shallow指定比较文件时是否需要考虑文件本身的属性(通过os.stat函数可以获得文件属性)。如果文件内容匹配,函数返回True,否则返回False。

 

filecmp.cmpfiles(dir1, dir2, common[, shallow])

 

    比较两个文件夹内指定文件是否相等。参数dir1, dir2指定要比较的文件夹,参数common指定要比较的文件名列表。函数返回包含3个list元素的元组,分别表示匹配、不匹配以及错误的文件列表。错误的文件指的是不存在的文件,或文件被琐定不可读,或没权限读文件,或者由于其他原因访问不了该文件。

 

    filecmp模块中定义了一个dircmp类,用于比较文件夹,通过该类比较两个文件夹,可以获取一些详细的比较结果(如只在A文件夹存在的文件列表),并支持子文件夹的递归比较。

 

dircmp提供了三个方法用于报告比较的结果:

          比较两个目录

    report():只比较指定文件夹中的内容(文件与文件夹)

    report_partial_closure():比较文件夹及第一级子文件夹的内容

    report_full_closure():递归比较所有的文件夹的内容

 

例子:在文件夹"1"中含有文件"1.txt", 在文件夹"2"中含有文件"1.txt"和"2.txt",其两个文件夹下面的文件"1.txt"内容一样,

 

>>>import filecmp

 

>>>x = filecmp.dircmp("1","2")

 

>>>x.report()

 

>>> 

 

diff 1 2

Only in 2 : ['2.txt']

Identical files : ['1.txt']

 

 

 

如果两个文件夹下面的文件"1.txt"内容不相同那么结果如下

 

>>>import filecmp

 

>>>x = filecmp.dircmp("1","2")

 

>>>x.report()

 

>>> 

 

diff 1 2

Only in 2 : ['2.txt']

Differing files : ['1.txt']

 

 

 

 

 

dircmp还提供了下面这些属性用于获取比较的详细结果:

 

    left_list:左边文件夹中的文件与文件夹列表;

    right_list:右边文件夹中的文件与文件夹列表;

    common:两边文件夹中都存在的文件或文件夹;

    left_only:只在左边文件夹中存在的文件或文件夹;

    right_only:只在右边文件夹中存在的文件或文件夹;

    common_dirs:两边文件夹都存在的子文件夹;

    common_files:两边文件夹都存在的子文件;

    common_funny:两边文件夹都存在的子文件夹;

    same_files匹配的文件

    diff_files不匹配的文件

    funny_files两边文件夹中都存在但无法比较的文件

    subdirs我没看明白这个属性的意思,python手册中的解释如下:A dictionary mapping names incommon_dirs to dircmp objects

 

 

 

 

分割线
感谢打赏
江西数库信息技术有限公司
YWSOS.COM 平台代运维解决方案
 评论
 发表评论
姓   名:

Powered by AKCMS