借助 OCR 工具识别图片中的文本,然后根据预设的规则依据图片中的文本对图片进行分类,最后依据分类结果将图片移动到不同的目录中
3.8+
使用 Microsoft Store 版本时,需要启用 Windows 长路径支持
本项目使用 PaddleOCR,需要安装 PaddlePaddle
python run.py src_path classify_config dst_path_format [-r] [-f filter] [-d date_format] [-D default_class] [-L logging_level]src_path 是存放图片的目录的路径,使用 -r 以包含子目录中的文件
filter 用于根据文件后缀名筛选文件,默认值为 png|jpg|jpeg|bmp,格式参照默认值即可
特殊:单独的 * 用于关闭筛选(接受所有文件)
classify_config 用于指定分类配置文件的路径
dst_path_format 是目标路径的模板,在模板中 {0} 表示文件的修改日期,{1} 表示首选分类结果(注:程序中使用 str.format 方法进行格式化)
-d date_format 用于指定模板中文件修改日期的格式,默认值为 %F,效果为 2025-04-26(注:程序中使用 datetime.strftime 方法进行格式化)
-D default_class 用于指定默认分类
当图片没有任何分类结果时,将默认分类作为首选分类结果
若不指定默认分类,则当图片没有任何分类结果时,图片不会被移动
-L logging_level 用于指定日志级别,默认为 WRANING
实验性功能,预计未来将删除此功能