日常对于批量处理文件的需求非常多,用Python写脚本可以非常方便地实现。本篇整理了Python中最常用到的文件操作,均采用内置函数实现,无论是批处理还是读取文件都会用到。
1. 遍历文件夹
Path对象的glob方法,能通过正则匹配来遍历文件夹并过滤文件,返回一个生成器。
1 2 3 4 5 6
| from pathlib import Path jpg_files = Path('./train_data').glob("*.jpg") print(type(jpg_files)) for jpg_file in jgp_files: print(jpg_file) print(jpg_file.name)
|
2. 获取文件信息
1 2 3 4 5 6
| from pathlib import Path jpg_file = Path('0.jpg') print(jpg_file.name) print(jpg_file.stem) print(jpg_file.suffix) print(jpg_file.stat())
|
3. 创建文件夹
1 2
| target_folder = Path("./test") target_folder.mkdir(parents=True,exist_ok=True)
|
这个好处是:
- 可以递归的建目录,
os
模块中目录是mkdir
,子目录是mkdirs
- 可以指定
exist_ok
参数,从而不必担心目录已经存在而报错
4. 删除文件夹
1 2
| import os os.system("rm -rf ./test")
|