-
정보검색시스템의 역사
- 1940년부터 도서관리를 위해 개발됨.
-
정보검색시스템과 DBMS의 비교
-
유사점
- 대용량 처리
- 소멸성(volatility): 변경가능성. 계속적인 데이타의 삽입/수정/삭제 가능함
-
차이점
-
정보검색은 확률론적이다.
- 검색 결과가 사용자의 요구에 맞는지 확신할 수 없다
-
DBMS의 데이타는 정형 데이타이지만, 정보검색시스템의 데이타는 비정형 데이타이다.
-
비정형 데이타: 구조화가 되어있지 않은 데이타
- 동일한 형태가 아님
- 일정한 크기가 아님
- DBMS 처럼 일반적인 쿼리를 사용할 수 없음
-
정형데이타에 비하여 검색시간이 오래 걸림
- 색인을 이용하여 검색시간을 빠르게 할 수 있음
- 하지만, 색인을 사용하면 색인된 데이타의 저장공간이 매우 커짐
-
-
-
'검색 엔진' 카테고리의 다른 글
[박혜웅] 역파일(inverted file) 생성 (0) | 2010.03.27 |
---|---|
[박혜웅] 색인 구조(indexing structure)의 종류 (0) | 2010.03.27 |
[박혜웅] 유의어 사전 (thesaurus) (0) | 2010.03.27 |
[박혜웅] 불용어 목록 (stoplist) (0) | 2010.03.27 |
[박혜웅] 어간 추출 (stemming) (0) | 2010.03.27 |