我们都知道网站优化是从网站建设的起初就要做的事情,很多时候我们后期的优化不到位的原因就是在于网站建设的过程中有些技术问题导致的。这些技术很多时候被称为蜘蛛陷阱,不知道你的网站是否有掉进这个陷阱中呢?今天我们就来总结一下蜘蛛陷阱是体现在哪里的呢?网站技术方面的陷阱:
有的网站整个页就是一个很大的flash,这就构成了蜘蛛陷阱。搜索引擎住宅区的html代码只有一个链向flash文件的链接,没有其他文字内容。还有网站在页的banner就使用一个flash,并且添加活动链接,虽然对用户来说能够直观的看到活动内容,但是对于蜘蛛来说,就无法识别,而且抓取不到flash的链向地址。由于javaScript可以创再出很多吸引人的视觉效果,有些网站喜欢使用javascript脚本生成导航系统。这也是比较严重的蜘蛛陷阱之一,虽然搜索引擎都在尝试解析JS脚本,不过我们不能寄希望与搜索引擎自己去客服困难,而要让搜索引擎跟踪爬行链接的工作尽量简单容易。jacascritp链接在SEO中也有特殊用途,那就是站长不希望被收录的页面,比希望被百度抓起的链接,可以使用javascript脚本阻止搜索引擎蜘蛛爬行!很多网站为了实现某种功能,强制使用cookies,用户浏览器如果没有启用cookies,页面显示不正常。搜索引擎蜘蛛就相当于一个禁止了cookies的浏览器,强制使用cookies只能造成搜索引擎蜘蛛无法正常访问。虽然现在搜索引擎在不断完善他的抓取功能,但是我们也要尽量避免不友好的页面,不然会给我们的网站带来不必要的麻烦。
网站布局方面的陷阱:使用框架结构设计页面,在网站诞生初期曾经听流行,但是现在网站已经很少使用框架了,不利于搜索引擎抓取是框架越来越不流行的重要原因之一,对于搜索引擎来说,访问一个使用框架的网址所抓取的html只包含调用其他html文件的代码,并不包含任何文字信息。搜索引擎无法判断这个网址的内容是什么。总之,如果你的网站还在使用框架,或者你的老板要使用框架结构,要记住的是,忘记使用框架这回事。和Flash一样,别浪费时间研究怎么让搜索引擎收录框架结构网站。有些网站的内容需要用户登录后才能看到的页面,这部分内容搜索引擎是无法看到的。这个要注意确定是否是需要登录以后才能看到。
有些网站使用sission ID(会话ID)跟踪用户访问,每个用户访问都会生成一个独特的session ID,加在URL中。搜索引擎蜘蛛的每一次访问也会被当成一个新的用户,URL中会加上一个不同的session ID,这样搜索引,擎每次来访问时所得到的同一个页面的URL将不一样,后面带着一个不一样的session ID。这也是常见的蜘蛛陷阱之一。
其他陷阱:除了301跳转以外,搜索引擎蜘蛛对其他形式的跳转都比较敏感,如302跳转,javascript跳转、meta refresh 跳转。如果必须转向,301转向是搜索引擎推荐的、用于网站更改的转向,可以吧页面权重从旧网址转移到新网址。其他的转向方式都对蜘蛛爬行不利。所以除非万不得已,尽量不要使用301转向以外的跳转。
动态URL值的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般来说动态URL不利于搜索引擎蜘蛛爬行,应该尽量避免。虽然百度现在已经能够识别动态URL了,但是也不能保证百分百能识别。