SEO的那些事儿
2条评论»去年Q4客串了点SEO的工作,简单总结下。当然SEO涉及内部优化和外部优化两个方面,内部优化主要是站点内链路结构的优化和关键词优化,外部优化则主要是外部链接优化。相对来说,内部优化更具可操作性,而且成本也较低,但是内部优化在整个SEO中只能占到30%~40%的比重,外部优化能带来实际效果的提升可能更显而易见,比如你在权重极高的站点获得了一个外部链接,那么你这个网站权重的提升将会比较明显,但我觉得外部优化不算个技术活儿,还存在很多“潜规则”,我表示兴趣不大。所以以下内容主要涉及的是SEO中内部优化的一点总结。
页面收录
SEO内部优化第一步当然不是关键词优化,第一步简单粗暴:让搜索引擎收录更多页面!抛开外链不谈,单从站点本身来说,让每一个页面都有链接(内部链接)链接进来,能被搜索引擎爬虫爬到即可。一般来说一个站点中首页具有权重是最高的,搜索引擎爬取的频率也非常高,所以内部链接结构优化也通常是从首页入手,如把最新更新的内容放到首页第一屏内。这样做一方面能提升用户体验,另一方面也是让搜索引擎能即时地抓取到新增加的页面。
但是首页能承载的内容总是有限的,为了增加站内页面的链接入口,通常站点也还会常用诸如“分类”、“存档”或是“推荐”这样的形式来增加内部链接的数量,在SEO中这些方法都是可行的。
除此之外你还可以通过“网站地图”来提交页面地供搜索引擎抓取。目前主流搜索引擎都支持通过站点地图提交网站链接,但是百度目前情况不明。每个sitemap.xml最多只能提交50000个链接,一个站点可以有多个sitemap文件,默认搜索引擎会试图抓取根目录下的sitemap.xml文件,你也可以将sitemap.xml添加到robots.txt文件(Sitemap: http://example.com/sitemap.xml)。多个sitemap的情况可以通过添加到robots.txt或是创建sitemap索引文件(其实我不知道这个东西咋用)来告诉搜索引擎sitemap的具体路径。一点建议:一个网站除了可以建立一个xml版的sitemap外,还可以考虑创建一个html的sitemap,除了能够增加搜索引擎爬取到站内链接的机会,而且对用户体验的提升也有大有益处的。
目前flash内的链接,JS产生的链接内容都是不能被抓取的。当你的网站必须要使用flash或是JS来创建内容时,最好是也能创建一个HTML版来共搜索引擎抓取页面上的链接。这个特性当然很多时候被用来控制页面权重的分配。
关键词优化
我们在搜索引擎中搜索关键词,搜索引擎将与这个关键词相匹配的网页检索出来,根据网页内容与这个关键词的相关性高低来返回给我们。那么搜索引擎是如何来确定一个网页与某个关键词的相关性的呢?
在确定关键词之前是提取关键词。搜索引擎爬取页面后,将页面内容通过分词技术等将页面文本内容提取出来。但是页面中的有些地方的词“先天性”的就具有一定的相关性。比如
- 页面标题(title)中出现的词
- hn标签中出现的词(通常是h1>h2>h3,其他h标签几乎没有任何权重了)
- 页面代码中越靠前的内容
- 黑体或斜体字体
- ……
所以技术手段的优化基本上就是将页面中的主要关键词分布到title,h1/h2/h3,页面内容靠前的部分来提高关键词的相关性。很多有分栏设计的页面,都可以通过技术实现将主要内容在代码中置前来排除其他辅助性内容的干扰。黑体和斜体字体较之于其他字体具有略高的相关性,当然这在用户看来也是具有强调提示作用的。关键词在上诉位置有所体现,同时在页面正文中也有一定的密度分布,那么这个关键词基本上在页面内容上的优化就OK了。但是这里注意一点:切忌堆砌大量关键词,有可能被视作作弊而受到惩罚。
除了页面中本身内容提取出来的关键词,外部链接文字也会对页面关键词产生影响,有时候影响还非常大。举个极端一点的例子,比如说某几个大型网站,PR值极高,在他们的首页上都有链接“handsome man”链接到我们的博客域名omiga.org,那么“handsome man”就有可能成为我博客的关键词,而且相关性极高。
在上面例子的过程中,一方面大型站点拥有极高的权重和信任度,那么搜索引擎会认为它的描述信息是准确可信的,同时也将它们的权重传递到了我的域名上。站点域名权重对关键词相关性的计算也有较大的影响。
keyoworks和description这两个曾经名噪一时的属性如今在关键词相关性计算方面基本上已经没有任何作用,因为曾经的极度滥用,搜索引擎已将这两个属性打入冷宫。但是description对于搜索结果的调整还是有很大的用处,基本上各搜索引擎还是首先考虑将description中的内容显示成搜索结果的描述信息。
权重传递
上面提到了权重的传递,权重的传递都是通过链接来完成,而且同等条件下外部链接比内部链接能传递更多的权重,因为内部链接毕竟是网站管理员自己所能控制的,搜索引擎不会让你随意的操作权重的分配。尽管如此,不等于说在站点内部控制权重的分配没有一点作用,你在pr值极高的首页链接到一个内页,这个内页同样还是会获得比较高的权重的。权重传递会随着页面深度的增加会逐渐衰减,一般来说>4层的链接后的页面已经分配不到第一个页面的权重了。比如:A链向B、B链向C,C链向D(A-B-C-D),那么D基本上能分配得到A的权重就极少了,哪怕A是http://www.miibeian.gov.cn/。很多网站使用了分页功能,这样做前面的一两页内容上的链接或许还能分配到一点权重,而后面的页码上的链接由于深度的关系,可能就分配不到任何权重了。
页面权重的传递除了可以通过外部链接来进行,其实向外导出链接也有可能获得一些权重,或是信任度。比如在网站A首页上,添加各大门户的首页链接,那么也是有可能对A的权重产生影响的。同时还有可能增加用户信任度,对提高点击量具有一定的作用!
站点内部权重的分配,一方面可以通过链接深度来实现,另一方面有一个rel=”nofollow”属性,你在wordpress的评论发布者链接上可以看到这个属性,搜索引擎不会为具有rel=”nofollow”属性的链接分配权重,也不会爬取这个链接,目前主流浏览器都支持这个属性。当然<meta name=”robots” content=”noindex,nofollow” />也具有相同的作用,不同之处是meta方式将使页面上所有的链接不被爬取也不能分配权重,百度目前不支持noindex。 阅读全文»
