1,一个关键词必然有与其相关的词语,目前由于是第2代搜索引擎,还是基于关键词的索引机制,于是基于一个词的拓展,而构建的相关,例如电影和免费电影而这种相关在很大的程度上,搜索可以以最少的计算,获得客户最大的认同感。,这样免费电影已经建立了一个硬盘索引关键词,不会再次建索引,固化了一个关键词。
输入某些词,但和关键字无关,收索引擎却给出相关,这种现象是一种指驴为马的现象,是由于大量客户的收索索引造成。比如一些公司的名字,开始收索引擎里面肯定是没有的,但很多人都在搜索,搜索引擎就认为这是一个词,就会在硬盘里面建立索引。
2,词相的分类与聚类相关
该技术概述:分类的技术主要是解决搜索在检索的结果中,消除重复或者近似的内容,展现更多样性的一个主题的检索结果。目的的搜索引擎已经利用一些简单的类聚方式,获得只显示每个软件相关结果1到2条相关数据,,比如对于一个关键词:北京游戏网,如果有搜录了10000个页面,搜索引擎一页展示10个页面,形成了1000个搜索页面,就相当于搜索引擎整理了1000这个主题搜索页面,对于一个软件,搜索引擎基于站内的一种类聚的概念,只会给出这个类聚的站内权重较高的一个到两个页面。
首先详细解释熟悉分类的概念,这是搜索为了确保检索计算准确性必备的技术。对于一个词语的分类,起码可以做到索引的基本不偏移和提取的唯一性,而且可以增加相关计算的有效性。借用这个技术,使用在咱的北京软件开发及优化中,可以起到意想不到的作用。
但是针对搜索的实际分类,我们不能详细的去获得,咱们只是按照常规的分类去分析,所以一定有一定范围的和搜索的不吻合性。
聚类,
a,站内制造巨量的单一主题,增加有效的定向相关性,获得其中之一的软件排序结果。
几十几百个页面,都是为一个页面服务,搜索引擎通过类聚的计算,提取出一个权重的页面。
b,首页的做法,比如BLOG的构建,构建一个关键词,用BLOG的方法去做,用大量的数据,推出一个页面,大家在进行软件设计的时候,可以结合这个BLOG,构建自己站内相关的软件。