- 문서 수집(크롤링)
-
문서 색인
- 문헌식별자 부여
-
단어가공
- 불용어제거, 어간추출 또는 형태소 분석, 가중치 부여
-
색인된 데이터(역파일) 생성
-
문서 검색
- 질의 분해
- 관련문서 검색
- 순위부여
< 바게식 정보검색시스템의 구조 >
'검색 엔진' 카테고리의 다른 글
[박혜웅] 적합성 피드백(relevance feedback) (0) | 2010.03.27 |
---|---|
[박혜웅] 불리언 모델 (boolean model) (0) | 2010.03.27 |
[박혜웅] 검색결과 평가(evaluation of IR) (0) | 2010.03.27 |
[박혜웅] 문서의 랭킹(가중치)를 결정하는 기본 요소 (0) | 2009.03.06 |
[박혜웅] 구글을 지탱하는 기술 요약 (0) | 2009.03.04 |