GoogleSitemaps使用指南

2019-04-11 08:07:41 来源: 延安信息港

Google Sitemaps是Google的一个和站管理员相关的工具,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动 通知 Google,方便Google进行索引。

初步使用了一下Google Sitemaps,用法非常简单。

首先在自己站根目录上上建立一个名为ml,文件本身可为空。然后在Google Sitemaps主页上单击验证按钮。Google会验证这一文件。如果验证通过,Google会显示一个已验证状态食堂洗碗机
,并提供一个指向用户站统计信息的链接。经过验证后,用户随时可以通过单击 站概述 页上的链接来查看自己站的统计信息。

接下来,建立Sitemaps文件捕野兔机器
。Sitemaps文件是XML格式的,Google建议使用Sitemaps协议格式的文件。不过使用BLOG的RSS甚至纯文本文件也都可以。XML Sitemaps 格式其实也很简单,建议多花几分钟转换为XML Sitemaps 格式后再提交Google。Sitemaps协议是XML的变种,用于概括与Web抓取工具相关的Sitemaps信息。对于每个址,都可以加入抓取 提示 (如修改日期和近似更改频率)。Sitemaps协议以 urlset 开始标记开始,以 /urlset 结束标记结束。 每个址包含一个作为父标记的 url 条目。 每一个 url 父标记包括一个 loc 子标记条目。 loc 是页文件的址。此址应以http开始并少于2048个字符。 lastmod 表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。其他的可选项可以不加。

,在Google Sitemaps的提交页面填写你生成的Sitemap地址(比如我的是),并提交即可。

过了几个小时后,再登录Google Sitemaps,可以看到功能菜单。

Google Sitemaps还提供了Google Spider对用户站访问情况的说明报告,如:查询统计信息、抓取统计信息、页分析、索引统计信息等信息。 查询统计信息 中,有列出几个进入你站的热门搜索关键字。在 抓取统计信息 中,可以看到Google Spider抓取站的概要统计和抓取错误的地址钢结构防火涂料
。实现了站主和Google Spider的信息交互。

Google Sitemaps的访问地址是:。

执行python sitemap_ --config=l

出现提示

[WARNING] Discarded URL for not starting with the base_url:

[WARNING] Discarded URL for not starting with the base_url:

[WARNING] Discarded URL for not starting with the base_url:

[WARNING] Discarded URL for not starting with the base_url:

[WARNING] Discarded URL for not starting with the base_url:

[WARNING] Discarded URL for not starting with the base_url:

[WARNING] Discarded URL for not starting with the base_url:

2005/12/27 18:54:24 支持(8)反对(13) 回复

l的有效性的验证,我觉得简单的办法就是用IE打开XML看看能不能有没有出错,不能通过的肯定要被GOOGLE打回来的,从出错开始的址GOOGLE都不会再抓下去了。

用ASP写的页,参数超过1个(比如中间带一个 符号的址)的址都不算是有效址

2007/1/4 12:29:20 支持(6)反对(14) 回复

(*)

验证(*)

本文标签: