本教程介紹了在dtSearch中,如何實現(xiàn)搜索結(jié)果命中關鍵字高亮顯示。
本文介紹了dtSearch的全文數(shù)據(jù)庫如何創(chuàng)建索引、如何創(chuàng)建和使用自定義數(shù)據(jù)源。
本文介紹了dtSearch緩存文件的相關知識,包括緩存文件如何創(chuàng)建索引,如何使用緩存等。
中文分詞一直都是中文自然語言處理領域的基礎研究,也是中文搜索引擎的核心模塊之一。目前而言的分詞系統(tǒng)絕大多數(shù)都是基于中文詞典的匹配算法,其中,最為常見的是最大匹配算法 (Maximum Matching,以下簡稱MM算法) ,而MM算法有三種:一種正向最大匹配、一種逆向最大匹配和雙向匹配。本文以正向最大匹配算法為例介紹其基本思想和實現(xiàn)。