基于 OCR 的屏幕截图分类工具

功能简介

借助 OCR 工具识别图片中的文本，然后根据预设的规则依据图片中的文本对图片进行分类，最后依据分类结果将图片移动到不同的目录中

依赖项

python

3.8+

使用 Microsoft Store 版本时，需要启用 Windows 长路径支持

PaddlePaddle

快速安装指南

本项目使用 PaddleOCR，需要安装 PaddlePaddle

PaddleOCR

快速安装指南

快速开始

安装依赖项
将整个仓库 clone 到你的计算机上，然后 cd 到 src 目录
编写分类配置文件
设计目标路径模板
用正确的命令行参数启动 run.py
只需等待

命令行参数

python run.py src_path classify_config dst_path_format [-r] [-f filter] [-d date_format] [-D default_class] [-L logging_level]

源目录路径

src_path 是存放图片的目录的路径，使用 -r 以包含子目录中的文件

后缀筛选器

filter 用于根据文件后缀名筛选文件，默认值为 png|jpg|jpeg|bmp，格式参照默认值即可

特殊：单独的 * 用于关闭筛选（接受所有文件）

分类配置文件

classify_config 用于指定分类配置文件的路径

目标路径模板

dst_path_format 是目标路径的模板，在模板中 {0} 表示文件的修改日期，{1} 表示首选分类结果（注：程序中使用 str.format 方法进行格式化）

-d date_format 用于指定模板中文件修改日期的格式，默认值为 %F，效果为 2025-04-26（注：程序中使用 datetime.strftime 方法进行格式化）

默认分类

-D default_class 用于指定默认分类

当图片没有任何分类结果时，将默认分类作为首选分类结果

若不指定默认分类，则当图片没有任何分类结果时，图片不会被移动

日志级别

-L logging_level 用于指定日志级别，默认为 WRANING

多线程并行

实验性功能，预计未来将删除此功能

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
docs		docs
src		src
.gitignore		.gitignore
LICENSE.txt		LICENSE.txt
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

基于 OCR 的屏幕截图分类工具

功能简介

依赖项

python

PaddlePaddle

PaddleOCR

快速开始

命令行参数

源目录路径

后缀筛选器

分类配置文件

目标路径模板

默认分类

日志级别

多线程并行

其他文档

About

Uh oh!

Releases

Packages

Languages

License

HPLZH/Screenshot-Classify

Folders and files

Latest commit

History

Repository files navigation

基于 OCR 的屏幕截图分类工具

功能简介

依赖项

python

PaddlePaddle

PaddleOCR

快速开始

命令行参数

源目录路径

后缀筛选器

分类配置文件

目标路径模板

默认分类

日志级别

多线程并行

其他文档

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages