登录鸟窝

用户名

密码

百度分词技术的深入解析

1已有 1073 次阅读  2011-06-15 08:53   标签搜索引擎  百度  计算机  blank  朋友 

    做百度搜索引擎优化的朋友应该,对百度的分词技术都会有所而闻。其实这个概念在好多朋友理解起来可能会有一定的难度。就单对分词的概念在网上都能找的到。但百度分词在SEO里的体现部分,却很少有说到。大家都在说学习SEO的真正操作就是为搜索引擎与用户来创造更有利的更权威的内容。了解百度搜索引擎的习惯,我们才能更好的SEO。

    在我刚学习SEO的时候,我也曾经被一个问题所困惑。对于网络来说,网页是成千上万的。而搜索引擎特别是百度它们能在非常短的时候内找到我们想要的内容。 就一般来说一个巨型的计算机也都是很难去实现的,他的一个检索时间只要一秒不到的时间。这个问题在我知道了百度的分词技术也得到一个非常满意的答案,同时 也对搜索引擎有了新的看法。

    其实分词技术用最普通的表达出来:每个搜索引擎都有他们的蛛蛛爬虫,他们任务就是去网络上采集与收取网页信息。把那些最“新”的数据采集回来,再进行进一 步的分类安放到数据库里。当每个访客在搜索框里输入他们想要的词的时,百度就会在他们的数据库里做相应检索最后做一定的排序显示出来。这个数据库的安放与 检索的过程中有一个非常重要的工作,那就是分词。

    百度会根据不同的词的不同类型进行分类。比如说我们去百度搜索宁波SEO培训, 我们来看下百度他的整个检索与分词过程。首先对于百度来说他是不是要把宁波SEO培训这个词做一个分割。宁波  SEO  培训 是不是可以分割成这样的三个不同的词。那么百度他首先要做的就是去他拉数据库里查找所有与宁波相关的信息,同样的道理是不是再去查找SEO这个词,最后是 培训。这个时候再把这三个词所检索到的内容进行组合排序显示出来。有一点是肯定是,百度会把相关性最高的排在相应比较前面的位置。

    我们可以在宁波SEO培训这个词的搜索页面看到,所有包括这三个词的网页标题都会有标红。这个就是百度分词的最直接的表现形式。现在知道大家在做站的时候 特别是标题为什么一定要特别的慎重。同理我们的词越短那么他的竞争度越大,因为这样的重复率会很高,相对之下的话网页的排序就会用其它的因素再做调整,所 以也就会出现了,他的标题里面没这个关键词还会有比较好的排名。因为SEO排名不会因为一个因素而确定下最后的排名,每个搜索引擎的算法都不一样。

    那么分词在我们SEO角度来看,有一点也是大家在操作过一些站点的时候会注意到的是。比如我做的是SEO,而且也把SEO这个词做到了百度首页。那么相对 来说我再去做SEO培训与宁波SEO或者是一些关于SEO的长尾词,是不是会容易一些?是的,因为在搜索引擎排序的过程中,有关于SEO的这个词在好多的 排名你已经有非常好的优势。而且你再去加一些修饰的长尾词,其实我们反过来可以理解成为,我们在做长尾了。相信SEO这个词与宁波SEO这两个词的做法与 难度是完全不一样的。所以我们在做站的时候,比如企业站的地方性的词,还有些SEO公司他们会有这么一说。做几个词送几个词的说法。一个方面是因为那些词 相对来说没有难度,再一个更多的是考虑到了SEO里面的连带性。

    做SEO重在去发现我们的每个操作,千万要记得自己的每一步操作一定要有可性行。不然只会分散你的更多的精力

来源:http://www.nb-seoer.com/post/106.html

分享 举报