本项目包含两个独立的 Web 应用程序,分别针对豆瓣电影和猫眼电影进行数据爬取、分析与展示。这两个项目均基于 Python 的 Flask 框架开发,提供了友好的 Web 界面。
一个功能丰富的电影评论分析工具,旨在深入挖掘观众对电影的评价。
- 核心功能:
- 数据爬取: 支持输入任意豆瓣电影详情页 URL,自动抓取电影基本信息及短评。
- 数据分析: 自动统计评分分布(力荐、推荐、还行等),利用
jieba进行中文分词提取高频关键词。 - 可视化展示: 生成精美的词云图直观展示情感倾向,提供综合仪表盘视图。
- 数据管理: 支持查看详细评论流,并可一键导出数据为 CSV 文件。
- 技术栈: Flask, Requests, BeautifulSoup4, Jieba, WordCloud。
一个专注于获取和展示电影排行榜数据的轻量级爬虫应用。
- 核心功能:
- 榜单爬取: 使用正则表达式高效爬取猫眼电影排行榜数据。
- 数据展示: 提供现代化的 Web 表格界面,清晰展示电影排名、名称、主演及上映时间。
- 多格式导出: 支持将爬取结果导出为 CSV 表格或 TXT 文本文件。
- 实时交互: 支持前端实时触发爬虫任务并更新显示。
- 技术栈: Flask, Requests, Re (正则表达式)。
请进入相应的子目录查看更详细的说明文档。以下是简要运行步骤:
确保您的电脑上已安装 Python 3.x。
cd 豆瓣
pip install -r requirements.txt
python douban.py启动后访问: http://127.0.0.1:5000
cd 猫眼
pip install -r requirements.txt
python maoyan.py启动后访问: http://127.0.0.1:5000
注意:两个项目默认都使用 5000 端口,请避免同时运行,或修改其中一个的端口配置。