-
확률 모델
- 전체 문서에 대한 질의에 대한 적합성(연관성) 정보가 검색하기 전에 수행되어 있다고 가정
-
확률모델의 유사도 계산 방법
-
log( 1/ IDF )
-
IDF(분모): 전체문서중 용어가 포함된 문서가 적을 수록 가중치가 높다.
- n/N ==> n/N-n
-
-
-
확률모델의 용어 가중치 계산
-
log( TF / IDF )
-
TF(분자): 적합문서중 용어가 포함된 문서가 많을 수록 가중치가 높다.
- r/R ==> r/R-r
-
IDF(분모): 전체문서중 용어가 포함된 문서가 적을 수록 가중치가 높다.
- n/N ==> n-r / N-n-R+r
-
-
-
-
Crof의 용어 가중치 계산
-
'검색 엔진' 카테고리의 다른 글
[박혜웅] 검색 연산의 종류 (0) | 2010.03.27 |
---|---|
[박혜웅] 벡터 공간 모델(vector space model) (0) | 2010.03.27 |
[박혜웅] 랭킹 모델(ranking model) (0) | 2010.03.27 |
[박혜웅] 확장 불리언 모델(extended boolean model) (0) | 2010.03.27 |
[박혜웅] 적합성 피드백(relevance feedback) (0) | 2010.03.27 |