统计文件个数
我们可以使用.iterdir方法获取当前文件下的所以文件.
import pathlib
from collections import Counter
now_path = pathlib.Path.cwd()
gen = (i.suffix for i in now_path.iterdir())
print(Counter(gen))
输出内容
Counter({'.py': 16, '': 11, '.txt': 1, '.png': 1, '.csv': 1})
通过配合使用collections模块的Counter方法,我们获取了当文件夹下文件类型情况。
前面我们说过glob模块点这里了解【glob模块的使用】,同样的pathlib也有glob方法和rglob方法,不同的是glob模块里的glob方法结果是列表形式的,iglob是生成器类型,在这里pathlib的glob模块返回的是生成器类型,然后pathlib还有一个支持递归操作的rglob方法。
下面的这个操作我通过使用glob方法,设定规则进行文件的匹配。
import pathlib
from collections import Counter
gen =(p.suffix for p in pathlib.Path.cwd().glob('*.py'))
print(Counter(gen))
展示目录树
下一个示例定义了一个函数tree(),该函数的作用是打印一个表示文件层次结构的可视树,该树以一个给定目录为根。因为想列出其子目录,所以我们要使用.rglob()方法:
import pathlib
from collections import Counter
def tree(directory):
print(f'+ {directory}')
for path in sorted(directory.rglob('*')):
depth = len(path.relative_to(directory).parts)
spacer = ' ' * depth
print(f'{spacer}+ {path.name}')
now_path = pathlib.Path.cwd()
if __name__ == '__main__':
tree(now_path)
其中relative_to的方法的作用是返回path相对于directory的路径。
parts方法可以返回路径的各部分。例如
import pathlib
now_path = pathlib.Path.cwd()
if __name__ == '__main__':
print(now_path.parts)
返回
('/', 'Users', 'chennan', 'pythonproject', 'demo')
获取文件最后一次修改时间
iterdir(),.glob()和.rglob()方法非常适合于生成器表达式和列表理解。
使用stat()方法可以获取文件的一些基本信息,使用.stat().st_mtime可以获取文件最后一次修改的信息。
import pathlib
now_path = pathlib.Path.cwd()
from datetime import datetime
time, file_path = max((f.stat().st_mtime, f) for f in now_path.iterdir())
print(datetime.fromtimestamp(time), file_path)
甚至可以使用类似的表达式获取上次修改的文件内容
import pathlib
from datetime import datetime
now_path =pathlib.Path.cwd()
result = max((f.stat().st_mtime, f) for f in now_path.iterdir())[1]
print(result.read_text())
.stat().st_mtime会返回文件的时间戳,可以使用datetime或者time模块对时间格式进行进一步转换。
其他内容
关于pathlib.Path格式路径转换为字符串类型。
因为通过pathlib模块操作生成的路径,不能直接应用字符串的一些操作,所以需要转换成字符串,虽然可以使用str()函数进行转换,但是安全性不高,建议使用os.fspath()方法,因为如果路径格式非法的,可以抛出一个异常。str()就不能做到这一点。
拼接符号"/"背后的秘密
/运算符由__truediv__()方法定义。 实际上,如果你看一下pathlib的源代码,你会看到类似的东西。
class PurePath(object):
def __truediv__(self, key):
return self._make_child((key,))