7月26日把服务器从辽阳搬回了沈阳,这下就不用总跑那么远维护去了,而且去那维护非常麻烦,到辽阳后需要再打车到总公司签通行证,再回来在保卫科报道然后才能进机房,而且周六周日不让进,平时找人重启机器特麻烦,晚上就没人接电话,网速还一般。只是头两年图辽阳机房比市内的便宜,现在市内的价格都降下来了,沈阳服务器托管一年4500,你要是希望找个速度快价格还好的话我能帮你找人再省几百块(查看我的联系方式)。
唠叨一通两地的机房情况,切入正题。
自从我把机器搬回沈阳后,就发现原先在谷歌网站管理员中的站点地图提交出现了错误提示:
| - | 我们访问您的 Sitemap 时遇到错误。请确保您的 Sitemap 符合我们的指南要求,并能够通过您所提供的位置访问,然后重新提交。 |
登录FTP查看sitemap.xml这个文件存在啊,然后打开看了下格式也正确啊,最近根本没有改动过。会不会因为换IP的原因?
在站点管理员工具-获取帮助-Sitemap错误http://www.google.com/support/webmasters/bin/answer.py?answer=83045&hl=zh-CN中开始逐条查找原因。
1、网站地图文件确实存在,所以不可能是404错误
2、网站没有设置任何身份验证
3、DNS服务器问题?我所有域名都在新网注册,并且都能正常访问,测试新网域名服务器也都正常,因此排除此问题
4、IP段曾经被封过?怀疑中……
我又加进新的站点进行验证,结果验证也不能通过,提示“访问超时”,关于“访问超时”这个错误,同样在“控制台-抓取错误”中也有提示,主要是robots.tx文件。开始以为是谷歌挑文件扩展名,当把.txt文件去掉后,还是有“访问超时”的文件出现。
根据以前的经验,和网上搜索结果来看,大部分提到了服务器配置问题,但是服务器除了更换IP外没有重做系统,最后问题集中得到了存放服务器的机柜上,为了网络安全,机柜有一台防火墙和抗拒绝设备,初步认定是防火墙或者是抗拒绝引起的。
远程进入防火墙查看日志,并没有任何阻挡谷歌IP访问的记录,同样在抗拒绝上也没有找到相关记录。难道是防火墙设置问题?远程更改防火墙设置,最后甚至把机器完全暴露在公网下,但问题应然存在。只有改天去机房进行操作了。
这期间查阅了大量资料,主要是在谷歌论坛的网站管理员讨论区查找,头一阵子谷歌员工挺热心的和站长见互动,但是最近看到大部分回帖解答问题的都是站长自己,这也没什么不好,但是回帖解答的反正是我这个问题没有给出让我满意的答案。搜索一下历史贴子,谷歌员工的解答:请联系服务器托管商进行解决,看看是不是服务器设置问题。
另一个比较详细的帖子给出了具体检测方法:
“
liuyutian 你好
从你贴出来的这些错误提示,看上去Google在访问你的网站时遇到了一系列服务器方的错误。我用wget,以Googlebot作为user-agent尝试访问你的网站,得到了下面的提示:
wget -U “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)” http://www.by3d.net/
–16:06:19– http://www.by3d.net/
=> `index.html.1′
正在解析主机 www.by3d.net… 61.155.154.108
Connecting to www.by3d.net|61.155.154.108|:80… 已连接。
已发出 HTTP 请求,正在等待回应… 500 Internal Server Error
16:06:20 错误 500:Internal Server Error。
从这里进一步看出,好像是服务器端的错误导致Google无法抓取网站。你当然可以给托管商(即新网)联系,让他们检查一下服务器方面是否对所有地区都可以正常访问。在之后,持续通过Google网站管理员工具观察网站的抓取情况,几天之后如果还有这样的错误提示,欢迎再回来提出。
希望对你有用!
”
wget是linux下的一个下载程序,我按照上例使用了一下,结果返回200,说明服务器还是正常地。
另外一种测试方式是测试robots.txt 网站管理员工具-网站配置-抓取工具访问-测试robots.txt
测试后没有任何错误,开始我以为是测试通过都正常,后来问题解决了都能正常抓取我又做了一遍才发现正常后会给出一个测试结果,如下图就是测试正常的结果。

大家看到解析结果那行有可能有些迷惑,但是用过wordpree的XML 地图生成器 就知道他会自动生成类似如下的robots.txt文件
User-agent: *
Disallow:
Sitemap: http://www.by3d.net/sitemap.xml.gz
它将站点地图地址放到了robots.txt文件中,以Sitemap:开始标记站点地图URL地址,可以使搜素引擎方便地找到站点地图。
好了再说问题的具体解决过程。
朋友晚上去机房调试,让我在家测试验证情况。将防火墙和绿盟全部从交换机中撤出,然后我这面验证提交一个网站,结果还是提示访问超时,这个郁闷啊,一直把问题锁定在防火墙和绿盟上,结果把两个设备撤出后还是出现错误提示。(后来才想起我只是用了文件验证还没使用标签验证)
后来一个朋友给了一个方式让试试,将笔记本配置成简单的主机环境将现在运行的服务器替换下来看是不是服务器配置问题。又隔了一天,我和朋友拿着配置好的笔记本电脑去了机房,开始时候问题仍然存在,当把防火墙和抗拒绝撤掉后,奇迹出现了:文件验证和标签验证全部通过!初步怀疑是两个设备中的一个设备问题,再把服务器接上,发现文件验证过不去,标签验证完全过去,而且网站地图抓取正常。我俩还回忆那天晚上他在机房我在家测试怎么没正常呢,开始我还开玩笑是不是那天你喝完酒来的,线接错了?后来一想由于当时着急有可能我只用了文件验证方式。
现在问题初步出来了出现在两台设备中的一台,然后服务器的小毛病就是文件验证无法通过,这个问题先放一边,接着测试。
把抗拒绝接上,依然正常,那就是防火墙的问题了,果不其然单独接上防火墙验证和抓取就不行了。
但是为什么在防火墙界面操作和日志上都找不到问题呢?暂时解决不了只能把防火墙给甩出来,只接绿盟暂时先用着,找到解决防火墙方法再继续搞。
至此困扰半个月的谷歌抓取问题总算解决了,通过自己做的程序发现谷歌已经开始频繁访问网站,就在成功解决问题的 第二天百度收录也正常了,看来防火墙不光阻挡了谷歌一个搜索引擎。
通常搜索引擎访问目的网站的端口只有一个80端口,而源端口就有很多,这是通过我制作的统计程序发现的,后来防火墙的厂家技术也在远程进行了设置,将所有的源端口都开放了,可是问题仍然存在。不是端口问题那又会是什么问题呢?
通过这件事发现网上很多朋友遇到过类似问题,基本都是服务器托管商帮助解决了,但具体解决方法在网上还真没搜索到。我的这个方法算是笨办法,防火墙还是得用的,不能一直这么甩出去,所有好的方法或建议可以留言给我,将感激不尽。
最初为了方便搜素引擎更好的抓取页面,防止更多的垃圾留言对网页排名的影响,谷歌雅虎等搜索引擎推出了nofollow标签。具体使用在留言的链接上,尽量减少垃圾链接对搜索引擎的影响。
因为nofollow能达到控制内部链接权重和PR流动及分布的目的,也有被用到友情链接处。但是近来显示谷歌对nofollow的重视度有所降低。
如果你在友情链接中使用了nofollow的话,是对交换链接对方的一种戏虐,对整个网站的链接交换起到不好的影响。而且nofollwo标签只对谷歌和雅虎等搜索引擎好使。举个例子,我在ZAC的留言处留言同样可以百度会给我一个很不错的外部链接排名。
个人认为nofollow除了留言处可以使用外,在内部链接上比如关于我们、广告联系等处无关紧要的网页链接上使用这个标签,效果还是不错的。
曾经说过这个博客用的域名以前是用来做别的网站,停用了一年后再次用来写博客。虽然在谷歌、百度收录还不错,但是首页在搜索引擎的描述仍然是以前的网站描述,不管我如何更新内容或者重新提交都不管用。
分析了一下,使用的博客系统是wordpress,默认是没有描述标签的。找到了一个SEO插件,添加上了描述标签,第二天谷歌就重新收录了首页更改了描述
。以前在谷歌网站管理员论坛上也看到了类似的问题,谷歌员工的回答通常是:搜索引擎根据算法,将认为最适合网站描述的内容显示在搜索结果中。
从这个例子我们可以看出,虽然描述标签在搜索引擎优化中的作用越来越少,但是有些时候还是对网站排名显示还是有一定作用的。搜索引擎会根据网站特点来决定是否显示描述内容,有时候还会把在第三方网站提交的描述作为网站的描述内容显示出来,比如谷歌会把开放目录中对网站的描述显示在搜索结果中。
我有一个站开始网页排名还不错,但是在一次百度大更新中网页排名掉了下来,以后虽然首页和频道页每天都有更新快照,但是新闻页的排名始终上不去,新的资讯也不是每天都有更新。这个站点使用的是PHPCMS系统,选择生成的纯静态页面,因为静态页面相对伪静态更容取得好的网页排名。我将网站的生成网页方式改成了伪静态,所有的频道、分类、内容页都隶属于网站根目录下的一个网页了,第二天的时候网页排名就有了明显变化,搜索引擎对内页开始收录显示,现在流量已经是过去的两倍了。
总结一下:如果是大型网站并且访问量相当大,那最好使用生成纯静态页面,但是目录深度尽量保证不要超过2层,网上的文章说是3层,但我个人经验建议2层就已经很深了。如果你的网站日均访问IP几万(我现在就是这个情况),选择一个负载好的CMS完全可以使用伪静态,在使用伪静态的时候不要太过分,是目录的就是目录,不要把网页也伪装成目录,扩展名还是要写的。

经常遇到一些公司网站需要迁移的案例,通常是网站已经存在多年,原有功能和界面已不能满足现有要求,需要对网站进行重构,并添加新的内容。但是原有的网站已经在搜索引擎上取得了较好的排名,担心网站在更换域名和界面后网页排名会受到影响。
通常我们的建议是:
你可以先将网站的某一个频道移动到新的空间下进行测试,然后使用301重定向技术将旧网页重定向到新网页上,通过这样的操作可以告诉搜索引擎你的这个频道已经彻底迁移了。通过观察这个已经迁移的频道在搜索引擎的收录情况,如果满意的话就可以对整个网站进行迁移。
我们建议不要使用将旧网站所有网页一刀切式的重定向到新主页上,虽然这样可以避免404错误页,但是对用户体验并不好。建议每页都重定向到新域名的对应页面上去。如果这样做实在是工作量太大,那也要尽量保证旧网页重定向到具体相似页面上去。
为了对你的网页排名进行跟踪观察,建议通过提交SITEMAP给谷歌网站管理员工具,定期查看新网站收录情况,检查排除404错误页。你还需要告诉你的友情链接朋友更新你的友情链接为你的新域名。为了你的网页排名平稳过渡,请保证你对旧网站的域名权限控制最好不少于180天
答应朋友写一下我个人的搜索引擎优化经验,象如何不被百度K站、如果已经被K了怎么办等问题。
以下方法不光防止被K站问题,只要都照做了可以保证搜索引擎排名靠前,这些都是我搜索引擎优化的核心秘籍.
1、站不全做完千万不要解析域名。
2、不管是用静态页还是伪静态技术,目录最多二级,使用简短URL。
3、页面模板严格执行W3C标准的strict方法,并使用校验器校验页面和样式表。
4、不光有资讯内容还要提供一些和网站主题相关小工具,如果你程序好的话。
5、交换友情链接,别去管对方PR如何只要收录正常就交换。
6、24小时开采集更新,采集文章处理成“原创”。
7、一定使用谷歌的网站管理员工具天天检查网站,并提交网站地图。
关于其他的提交网站、关键词什么的我就不重复说了,以上七点是我的一些搜索引擎优化经验,谈不上什么秘籍,拿出来和大家一起探讨研究,还请多多指正。
搜索引擎优化实战每天一帖今天进行到第七天了,这是第一季的最后一天。过些日子我会续写第二季,继续记录我的搜索引擎优化经验。第一季内容将编辑成PDF格式提供下载,里面涉及到的程序也将无偿提供下载,感谢大家的支持,我会一直不停努力下去!
本季最后一天我们来谈谈内部链接。
如果说外部链接是将你的网站与其他网站组织成一张大网的话,那么内部链接就是将你的网站内所有网页织成一张小网。搜索引擎优化中有一术语叫孤页,就是说页面上无任何链接指向网站任何页面,在WEB空间中完全孤立的一个页面,这样的页面是不会被搜素引擎收录的。
我们的文章发表后最少会有一个导航链接指向网站首页或者频道页,搜索引擎根据文章列表链接跟踪发现最新发表的文章,这种一对多的链接是最基本的内部链接,现在我们要把这种链接关系发展到多对多的关系。
通常CMS提供TAG功能,相关文章会链接到TAG列表中,这也是不错的一种方法,但是我觉得这种方法还不够好,通过WORDPRESS博客的Pingbacks功能获得启示。如果你的A网页与B网页有相关性的话,你可以在A网页关键词处使用标签<strong>,并链接指向到B网页,同样B网页可以指向A网页,同理C网页也可以和A、B网页进行交叉链接。
首先这样做的好处是用户可以方便找到一系列相关内容的网页,其次是提高了关键词获得好的排名机会。
大家可以现在就动手做一做,相信过段时间你的网站一定会获得好的排名,这种方法对中小型企业网站尤其见效。
好了,本季已经圆满结束了,期待下一季早些到来!
今天朋友告诉我,我的博客pr值已经是3了!马上用站长工具进行PR值查询,果然我的博客PR值一下子从0窜到了3,我去群里一看原来昨天晚上GOOGLE更新了PR值,很多博客的PR值都更新了,没想到开博不到两个月pr值就一下更新到3。分析下原因主要还是原创内容频繁更新,还有就是交换了几个好的友情链接。
我在博客里和大家分享了下PR值更新的喜悦,与几个博主交换了友情链接,看来PR值高还真好交换友情链接啊。