Skip to content

2hwayoung/gentle-graph

Repository files navigation

사용자 행동 기반의 실시간 이슈트렌드 분석; 그래프DB를 활용하여

연세대학교 컴퓨터과학과 2021-2 소프트웨어종합설계(1) 프로젝트

1. Overview

이 프로젝트는 다양한 온라인 플랫폼에서 수집한 사용자 행동 데이터를 바탕으로 실시간 이슈 트렌드를 분석하고 시각화하는 시스템을 구축하는 것을 목표로 합니다. 이를 통해 개인의 가치 판단을 도와줄 수 있는 객관적인 지표를 제시하고자 하였습니다.

2. Team

  • Team name: GentleGraph
  • T.M 김대현 컴퓨터과학과
  • T.M 이화영 산업공학과
  • T.M 유승수 산업공학과

3. Skills

  • Python Crawling
  • Kafka
  • Airflow (with PostgresDB)
  • Neo4j
  • AWS EC2 4대

4. Structure

5. Flow

  1. 데이터 수집: 네이버뉴스, 다음뉴스, 유튜브 동영상 데이터 수집 (댓글수, 평가(반응)수, 조회수, 좋아요/싫어요수 등)

  2. 데이터 처리: Kafka 실시간 데이터 처리(5분 간격)

  3. 실시간 인기 검색어 추출: KakaoBrain의 Pororo(NER)을 이용하여 실시간 이슈 검색어 추출

  4. 그래프 DB: Neo4j 그래프 데이터베이스 구축

  5. 키워드 분석 모델: 키워드 분석 Decision tree 모델 설계 및 학습

  6. 워크플로우 관리: Airflow Scheduler 구축

  7. 그래프 시각화 및 웹서비스: Neo4j Bloom 그래프 시각화와 Flask로 웹서비스 구현

6. Report

About

Real-time issue trend analysis based on user behavior using graphDB

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors