嘉兴网页设计:所有关于Canonicals

2019.07.17 mf_web

150

规范链接元素

规范链接是HTML元素,通过指定网页链接的首选(规范)版本,帮助网站管理员防止重复内容失误,作为该网页搜索引擎优化的一部分。当试图找出可通过多个URL获得的文档的原始来源时,搜索引擎是一个经过验证的问题。

内容复制可以通过多种方式实现:

  • 打印网站版本

  • 不同主机或协议的可访问性

  • 内容管理系统导致的多个URL

  • GET参数

简而言之,当可以从多个URL访问相同的内容时,会发生重复的内容不幸。搜索引擎的目标是使用规范链接定义作为搜索结果的输出过滤器。如果结果中有多个具有相同内容的URL,则将考虑规范URL定义,以确定链接的原始内容源是什么。

规范链接元素确实证明是有益的,但谷歌在使用301重定向时实际上更喜欢它。这是因为谷歌的蜘蛛可能会选择绕过规范的链接元素,如果他们认为它更有利。

规范URL可用于改进链接,甚至可以为通过多个URL结构或通过联合提供的内容排序信号。在考虑在线购物系统和内容管理时,通过多个URL访问一条内容并不罕见。内容联合使内容更容易传播到不同的URL和整个域。

一些例子如下:

  • 由于用户的会话和/或搜索首选项,一个项目的产品页面可以包含动态URL。

  • 博客系统可以自动为同一帖子保存多个网址,因为它们是在不同的部分下提交的。

  • 您的服务器旨在为http协议或www子域提供相同的内容。

  • 在博客上提供的用于在其他网站上进行联合的内容将在这些域上全部或部分复制。

虽然所有这些都使得开发和分发内容变得更容易,但当个人使用搜索引擎访问页面时,它们确实会带来一些挑战。

这可能发生在:

  • 合并链接将发出重复或类似内容的信号。这有助于搜索引擎在一个首选URL和首选URL上整合他们对每个URL的信息。

  • 针对单个产品或主题跟踪度量标准。当存在各种URL时,接收特定内容的合并度量标准更具挑战性。

  • 您确定了您希望别人看到的网址。这可能意味着人们看到的链接是一个更简化的版本,在阅读时更有意义。

  • 联合内容得到解决。当您将您的内容联合发布以在其他域上发布时。在这种情况下,您需要将页面排名合并到首选URL。

要专门解决这些问题,建议您为通过多个URL提供的内容定义规范URL。有几种方法可以定义规范URL。


告诉GOOGLE您的首选域名

您必须告诉Google您希望将哪个版本的网站用于域名。这可以是https://www.example.com或https://sample.com。如果首选域名设置为后者,Google将以相同方式处理前者的链接。

设置首选域名后,Google将使用该信息进行网站的任何未来抓取以及任何索引刷新。在显示网址时,Google还会考虑您的偏好。如果您尚未指定首选域,Google可能会将同一域的www和非www版本视为对不同页面的不同引用。更改可能不会立即反映在索引中,并且现在在索引中显示URL的非首选版本的所有页面都将保留在索引中,直到刷新索引为止。

要指定首选域,您将转到Search Console主页,然后单击要编辑的站点。单击齿轮图标,然后单击“站点设置”。在“首选域”部分中,选择所需的选项。

您可能需要验证您是否拥有域的两个版本(www和非www)。设置首选域会影响抓取和索引 - 这就是两个版本都需要验证的原因。一般来说,两个版本都会针对相同的物理位置,但每次都不是这样。一旦验证了域的一个版本,Google就可以使用原始验证码验证另一个版本。尽管如此,如果您删除了元标记,文件或DNS记录,则需要完全重复验证过程。


使用特定链接元素指示首选URL

当有一个链接用作首选URL时,仍可能存在指向该首选链接的各种链接。可以通过执行以下操作向搜索引擎指示:

  • 使用rel =“canonical”属性将链接元素<link>添加到页面的<head>部分。

这将指示访问特定链接的首选URL,使搜索结果在搜索结果中访问时更有可能显示此链接结构。

为避免错误,请使用绝对路径,而不是使用rel =“canonical”元素的相对路径。


使用站点地图为同一内容设置首选URL

选择您的每个网页的首选(规范)网址,并通过在站点地图中提交规范网址来转发您的偏好设置。Google不保证他们会使用通过站点地图提交的网址,但这是告诉Google有关网站中被认为最重要的网页的更好方法之一。


301重定向非规范网址

想象一下,您的网页可以从多个URL结构访问。选择其中一个URL作为规范(首选)目标是明智之举,然后使用301重定向将用户从其他URL发送到首选URL。从服务器端进行301重定向是确保将搜索引擎和用户定向到正确页面的最佳方法。301状态代码表示网页已永久移动到其他位置。


指示如何处理动态参数

您可以使用参数处理向Google指出您希望忽略的所有参数。当您选择忽略某些参数时,可以减少Google索引中重复的内容量 - 这最终会使网站更容易抓取。例如,您可以指示您希望在链接中忽略会话ID。

当Google检测到重复内容时,算法会将重复的URL分组到群集中,然后决定算法认为哪种最佳URL结构代表搜索结果中的群组。然后,Google会尝试将有关群组内网址的内容(如链接的受欢迎程度)整合到一个有代表性的网址,这有助于提高Google搜索结果中网页排名的准确性。

当Google无法找到群集中的所有网址或无法选择首选的代表网址时,您可以使用Google提供的网址参数工具,以便分享有关如何处理包含特定网址的网址的信息参数。

注意:建议在使用URL参数工具时要小心。如果在不应该抓取哪些内容时出现错误,Google最终可能会无意中排除内容被抓取。


在HTTP标头中使用CANONICAL LINKS

如果您能够配置服务器,则协议涉及使用rel =“canonical”HTTP标头,以便为任何HTML文档或其他文件(如PDF)指定规范URL。例如,一个网站可以通过几个不同的URL提供相同的PDF,您将使用rel =“canonical”标题,以便向Google指定PDF文件的规范URL。这些链接标题元素目前仅支持Web搜索。

HTTP标头字段构成包含请求和响应消息的网页标题的一部分。它们定义了HTTP事务的操作参数。这些字段在请求或响应行之后传输 - 这些是消息的第一行。这些字段由冒号分隔,并通过明文字符串类型格式包含名称值对。这将以回车和换行顺序结束。空字段将指示标题部分的结尾。


HTTP与HTTPS:GOOGLE更喜欢的内容

除了信号冲突之外,Google更喜欢在规范链接上使用HTTP页面上的HTTPS页面。一些例子是:

  • HTTPS页面具有无效的SSL证书。

  • 包含noindex机器人元标记的HTTPS页面。

  • HTTPS页面将具有到HTTP页面的rel =“canonical”链接。

  • HTTPS页面将包含不安全的依赖项。

  • HTTPS页面是自动的,而HTTP页面则没有。

  • HTTPS页面将用户重定向到HTTP页面。

虽然Google的系统会自动优先于HTTP页面上的HTTPS页面,但您可以通过执行以下操作之一来保证此行为:

  • 实施301或302重定向从您的HTTP页面到您的HTTPS页面。

  • 添加从HTTP页面到HTTPS页面的rel =“canonical”链接。

  • 实施HSTS。

  • HSTS代表HTTP严格传输安全,是一种互联网安全机制,旨在帮助保护网站免受cookie劫持和协议降级攻击。它允许Web服务器决定Web浏览器只能使用安全的HTTPS连接访问它。

  • HSTS策略通过HTTP响应头字段通过服务器传递给用户。这称为“严格传输 - 安全”。此HSTS策略将指定用户代理仅以安全方式访问服务器的时间段。

  • HSTS策略将有助于保护Web用户免受被动和主动网络攻击。

  • 如果初始请求采用不安全的协议(如HTTP),或者如果初始请求的URI是通过不安全的通道获得的,则初始请求将不受主动攻击的保护。

  • 主要的Web浏览器通过使用包含支持HSTS的所有已知站点的列表来解决HSTS的限制。

  • 虽然这些列表很大,但它们无法覆盖整个互联网。

为了防止Google错误地将HTTP页面作为首选链接,您应该避免这样做。错误的SSL证书和HTTP到HTTPS重定向可能会导致Google通过HTTPS选择HTTP。即使使用HSTS也不会覆盖此偏好。还建议在站点地图或hreflang部分中包含HTTP页面,而不是在HTTPS版本中。最后,为不正确的主机变体实施SSL或TLS证书。例如,sample.com将作为www.sample.com的证书 - 证书必须与完整的网站URL匹配,或者将是一个随机证书,将用于域中的多个子域。

寒枫总监

来电咨询

18868949445

微信咨询

寒枫总监

TOP