针对四位一体课表,进行数据爬取与整理,导出数据文件。
是空闲教室查询系统的数据源支撑。
支持公网环境下部署,异步并发爬取数据并整理导出数据文件
项目链接 »
查看Demo
·
报告Bug
·
提出新特性
具体逻辑都写在注释里。
- Python3.9+
- 需要的包依赖:
interval==1.0.0
requests==2.26.0
lxml==4.6.3
selenium==3.141.0
(此处selenium使用的是Chrome)
- 安装上述所需包依赖
- Clone the repo
- 配置根目录下user.json中的username和password为自己的vpn登录账号密码。
git clone https://github.com/cicidoll/QueryPpsucClassRoomSpider.gitfiletree
├── /data/
│ ├── classRoomData.json
│ └── mobilizeBorrow.json
├── /config/
│ ├── classRoomNumConfig.json
│ ├── createUrlDic.json
│ ├── dataTemplate.json
│ ├── mobilizeBorrowTemplate.json
│ └── requestConfig.json
├── /networkAppClass/
│ ├── __init__.py
│ ├── create_url_pool.py
│ ├── get_html.py
│ ├── get_urldata.py
│ ├── get_week.py
│ ├── login.py
│ └── process_text.py
├── .gitignore
├── main.py
├── README.md
├── requirements.txt
├── user.json
└── utils.py
该项目使用Git进行版本管理。您可以在repository参看当前可用版本。
17M053
联系方式:ayaseemt@qq.com