本项目为武科大助手新闻资讯的爬虫脚本项目,从武科大新闻官网爬取新闻,并存入数据库中。
- 爬取武科大新闻官网的新闻列表和详情页。
- 支持多页面、多模块的新闻爬取。
- 自动存储爬取的新闻数据到 PostgreSQL 数据库。
- 提供灵活的配置文件支持,方便扩展爬取目标。
-
克隆项目到本地:
git clone https://github.com/your-repo/university-news-spider.git cd university-news-spider -
安装依赖:
npm install
-
配置数据库:
- 修改
config/database/database.json文件,填写正确的数据库连接信息。
- 修改
-
配置爬取目标:
- 在
config/spiders目录下添加或修改 JSON 配置文件,定义爬取的目标网址和选择器。
- 在
-
启动爬虫:
node index.js
-
查看日志输出,确认爬取任务是否成功。
欢迎提交 Issue 或 Pull Request 来改进本项目。
本项目采用 MIT 许可证。