Skip to content

saki168947/-

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

电影数据爬虫与分析项目集合

本项目包含两个独立的 Web 应用程序,分别针对豆瓣电影猫眼电影进行数据爬取、分析与展示。这两个项目均基于 Python 的 Flask 框架开发,提供了友好的 Web 界面。

📂 项目列表

1. 豆瓣电影评论爬虫与分析系统 (/豆瓣)

一个功能丰富的电影评论分析工具,旨在深入挖掘观众对电影的评价。

  • 核心功能:
    • 数据爬取: 支持输入任意豆瓣电影详情页 URL,自动抓取电影基本信息及短评。
    • 数据分析: 自动统计评分分布(力荐、推荐、还行等),利用 jieba 进行中文分词提取高频关键词。
    • 可视化展示: 生成精美的词云图直观展示情感倾向,提供综合仪表盘视图。
    • 数据管理: 支持查看详细评论流,并可一键导出数据为 CSV 文件。
  • 技术栈: Flask, Requests, BeautifulSoup4, Jieba, WordCloud。

2. 猫眼电影爬虫 Web 应用 (/猫眼)

一个专注于获取和展示电影排行榜数据的轻量级爬虫应用。

  • 核心功能:
    • 榜单爬取: 使用正则表达式高效爬取猫眼电影排行榜数据。
    • 数据展示: 提供现代化的 Web 表格界面,清晰展示电影排名、名称、主演及上映时间。
    • 多格式导出: 支持将爬取结果导出为 CSV 表格或 TXT 文本文件。
    • 实时交互: 支持前端实时触发爬虫任务并更新显示。
  • 技术栈: Flask, Requests, Re (正则表达式)。

🚀 快速开始

请进入相应的子目录查看更详细的说明文档。以下是简要运行步骤:

环境准备

确保您的电脑上已安装 Python 3.x。

运行豆瓣项目

cd 豆瓣
pip install -r requirements.txt
python douban.py

启动后访问: http://127.0.0.1:5000

运行猫眼项目

cd 猫眼
pip install -r requirements.txt
python maoyan.py

启动后访问: http://127.0.0.1:5000


注意:两个项目默认都使用 5000 端口,请避免同时运行,或修改其中一个的端口配置。

About

孩子不懂事,写着玩的

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors