본문 바로가기

검색 엔진

[박혜웅] 색인 및 검색 과정

  • 문서 수집(크롤링)
  • 문서 색인

    1. 문헌식별자 부여
    2. 단어가공

      • 불용어제거, 어간추출 또는 형태소 분석, 가중치 부여
    3. 색인된 데이터(역파일) 생성

  • 문서 검색

    1. 질의 분해
    2. 관련문서 검색
    3. 순위부여

 

< 바게식 정보검색시스템의 구조 >