搜索引擎分词三种算法

发布时间:2020-03-22编辑:脚本学堂
为大家介绍下搜索引擎分词的三种算法,搜索引擎分词是根据用户关键词查询后进行处理后呈现各种匹配方式的技术。有需要的朋友参考下。

搜索引擎分词是根据用户关键词查询后进行处理后呈现各种匹配方式的技术。

简要介绍搜索引擎分词三种算法。

1、最小分词法,从小到大把关键词切分为不同词组,在每一个句子中找出最小的词组,然后按分成单个字,开始最小的字与词合并。

2、正向最小匹配与最大匹配法,从左往右距离最近的两个单词匹配就是最小匹配,相对权词高;同理,有中等匹配与最大匹配。

3、逆向最小匹配与最大匹配法,从右往左词组匹配法,主要是为了补充正向匹配法的不足,同样权词与排名是看两个词之间的距离。

总结:对于距离相对较远的,匹配度偏低,也就是权值低,在相同的时间、资源与成本的情况下,排名难度会大些,这类的词可以通过描述标签增加关键字密度,让搜索引擎对于网站主题更好的理解,同时再借助站内与站外描文本链接完全匹配进行投票支持即可。