블로그 이미지
다엄
잘해야지

calendar

1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

Notice

    'Project & studying'에 해당되는 글 10

    1. 2009.06.22 JoongVAC 시스템 기본 구조도4

    1. 요구사항 분석

    가. 사용자가 검색창에 txt 파일을 입력한다.(검색어도 같이 입력 가능)

    나. 입력 파일과의 유사도가 높은 순서대로 검색 결과를 화면에 보여준다.(링크 포함)

     

    2. 시스템의 개략적인 구조

    가. 사용자가 입력한 파일의 이름을 받는다.

    나. 파일의 실제 내용을 뽑아낸다. 이 내용이 원본 문서가 된다. (일단 txt파일에 대해서만 구현. doc, hwp 추후 지원)

    다. 핵심단어를 추출한다. 단어는 세 글자 씩 잘라서 빈도수가 높은 단어를 추출한다.

    라. 각 단어에 대해서 Google 검색 엔진으로 검사하여 검색된 페이지의 내용을 추출한다.

    마. 검색된 각 페이지와 원본 문서를 비교하여 유사도를 계산한다.

    바. 유사도가 높은 n개의 검색 결과가 추출되는데, 이 검색결과에 대해 다~마 과정을 반복하면 유사도 트리가 만들어진다.

    사. 결과물들을 화면에 출력하고 DB에 저장한다.

    posted by 다엄