Process Overview


1. 일정 시간마다 주요 뉴스 사이트 크롤링

뉴스기사(article) 테이블 설계

2. 보고서 생성

  1. 뉴스 내 주요 단어들을 추출하고 그것을 수치화 시킬 것인지
    1. TextRank를 이용하면 문장 추출 뿐 아니라 키워드 추출도 가능하다.
    2. 이제 전체 문서에서 상위 10개 정도의 키워드를 카운트 해서 그래프로 그려주면 좋을 것 같다.

API 설계 (임의로 생각해본거니 백엔드 분들은 참고만 해주세요)

HTTP API

References