磐安网站建设:可爬行性与可索引性对SERP排名的影响

2019.07.23 mf_web

155

Crawlability vs. Indexability: The Affect on SERP Rankings


如今,企业更加意识到SEO在帮助他们在网上找到的重要作用。但是,许多因素可以定义任何给定网站对于网页抓取工具的SEO友好程度,对于很多人来说,所有这些因素都会让人感到困惑和压倒一切。为了解决问题,我们将研究两个经常被忽视的重要因素:可爬行性和可索引性。那么什么是可抓取性?可转换性怎么样?让我们首先回顾搜索引擎如何实际发现网页上的页面,以便更好地理解这两个术语。 


搜索引擎如何在网上发现页面? 

搜索引擎使用所谓的网络爬虫来了解网络上的新页面或更新页面。这些网络抓取工具主要是用于查找和索引内容的漫游器。他们将浏览类似于人的网站 - 从链接到链接将数据带回他们的服务器。他们能够找到普通人不会寻找的东西,例如alt标签,元描述标签,结构化数据以及网站代码中的其他元素。最终,它们涉及搜索引擎访问和索引网站页面的能力。 

  • 爬行是指搜索引擎通过网页内容抓取能力。 

  • 可索引性是指搜索引擎分析页面并将其添加到索引的能力。 

谷歌可能能够抓取一个网站; 但是,可索引性问题可能会阻止它为每个页面编制索引。


如何知道我的网站是否可抓取和可转换? 

如果您之前没有查看过SEO的技术方面,那么您的网站很可能无法抓取和编制索引。了解并熟悉这些术语非常重要,以确保搜索引擎机器人能够抓取您的网站页面并将其编入索引。那你怎么知道你的网站是否可抓取和可索引?如果你对这些术语不熟悉,可能就是这样,但事实并非如此。但是看看你的搜索引擎排名是一个很好的方式。您是否出现与您的产品和/或服务相关的搜索? 

如果您没有参与与您的产品和/或服务相关的搜索,但您的内容在每个页面上提及您的目标关键字几次,那么您可能会遗漏一些与可抓取性和可索引性相关的重要方面。如果您还没有针对可抓取性和可索引性优化您的网站,那么您可能会错过您所采取的任何离页SEO工作的好处。 


什么会影响可追溯性和可索引性? 

有各种因素会影响任何给定网站的可抓取性和可索引性。以下是一些要记住的事项: 

  1. 您网站的结构:看看您网站的结构。您是否可以从任何给定页面访问您网站的主页?大多数人确保主页上有主页的链接,但这还不够。您希望人们能够轻松地从任何区域导航。只要有可能,也链接到其他相关和权威的网站。 

  2. 有用信息的内部链接:如果您有一个服务页面或博客文章提到您已经在网站上其他地方写过的主题,请在该服务页面或博客文章中超链接该主题。这将允许抓取工具看到您的内容相互关联 - 允许他们更好地浏览和抓取您的网站,并增加正确索引的可能性。 

  3. 过时或不受支持的技术:搜索引擎机器人不再可以抓取多种形式的网站技术。确保您没有使用任何过时或不受支持的内容,包括但不限于Ajax和JS,它们实际上阻止了机器人抓取网站。此外,请检查所有编程语言,以确保它们是最新的。 

  4. 阻止访问僵尸程序的代码错误: Robots.txt是一个文本文件,用于指示机器人如何在网站的特定页面上进行爬网。这些文本文件可以通过允许或不允许该行为向搜索引擎指示是否要爬行。在某些情况下,您可能不希望搜索引擎索引特定页面。但是,如果你这样做,你将需要确保没有代码错误阻止它发生。 

  5. 服务器错误和/或重定向损坏:如果您的网站上经常出现服务器错误和/或重定向损坏,您的访问者可能会离开而不是继续尝试加载页面。这不仅可以提高您的跳出率,还可以阻止抓取工具访问您的网站内容并为其编制索引。确保立即解决这些问题。 


有什么可以帮助搜索引擎机器人抓取并索引网站? 

当您尝试帮助搜索引擎机器人抓取并为您的网站编制索引时,第一步是查看影响可抓取性和可索引性的上述因素列表。在您继续前进之前,您需要处理任何阻止搜索引擎机器人抓取您的网站并将其编入索引的问题。一旦您处理了上述因素列表,就有办法提高可爬网性和可索引性。 


第1步:向Google提交Sitemap

有些人认为站点地图是一种新奇事物,但事实并非如此。事实上,站点地图一直是开发人员已知的最重要的网页设计最佳实践之一。站点地图对于任何给定的网站都是必不可少的 - 提供网站和搜索引擎之间的重要链接。正确构建站点地图并确保其结构良好非常重要。这将使您的网站更容易抓取,并在用户查找与您的产品和/或服务相关的关键字时为其提供更准确的搜索结果。 

那么站点地图到底是什么?它是一个位于域的根文件夹中的小文件。它包含指向您网站上每个页面的直接链接。这实际上告诉搜索引擎所有关于您的内容,并且无论何时更新,它都会提醒搜索引擎爬行并查看更新。添加站点地图后,请确保将其保持最新状态。 


第2步:定期更新您的内容

虽然重要的是不要忽视SEO的技术方面,但内容比许多人想象的要重要得多。这是任何给定网站的基本必需品,幸运的是,它在帮助您在搜索引擎中排名更高时拥有很大的力量。当我们引用内容时,您可能会考虑传统页面和博客帖子。但这不是唯一的内容形式。您可以超越文本以包含图像,视频,幻灯片,音频等等。内容不仅可以帮助访问您网站的用户更好地了解您的操作,还可以帮助您更快地抓取您的网站并将其编入索引。

这是为什么?答案很简单:谷歌和其他搜索引擎花费更多时间来抓取和索引定期更新的网站。尽量确保你写的内容是独特的,长的(大约2000个或更多的单词),因为搜索引擎的排名会高于他们排名“瘦”的内容。您希望您的内容满足搜索者的意图,这意味着您应该使用各种形式的内容,让人们保持参与和兴趣,这样他们就可以在您的网站上停留更长的时间。 


第3步:增加和加强您的内部链接 

Google和其他搜索引擎依赖于您网站中的外部和内部链接,以确定哪些内容与内容相关,以及该内容的价值。当他们从网络上的某个位置链接时,他们会发现您的帖子和页面最佳。例如,内部链接可以让搜索引擎更深入地了解您网站的背景和结构。从本质上讲,抓取工具将到达您的主页并按照第一个链接进行操作。他们将通过您的网站 - 了解各个帖子和页面之间的关系,以了解主题。

首先浏览您的网站,逐页浏览,找到关键字的任何提及,无论是短期还是长尾。将这些关键字与您网站上的相关信息相关联,包括博客帖子或服务页面,以帮助您提高搜索排名。这将显示所有内容都已连接的搜索引擎。 


第4步:提高页面加载时间

页面速度通常与网站速度混淆,但请记住,它们是完全不同的。例如,网站速度是指任何给定网站上的网页浏览样本的网页速度。另一方面,页面速度具体是指在特定页面上显示内容所需的时间。Google提供了一种确定页面速度的工具。通常,搜索引擎只有有限的时间来抓取和索引任何给定的站点。这被称为机器人的“爬行预算”。您希望确保您的网页快速加载,以便抓取工具能够在他们没有时间之前访问。 

此外,如果您的网页加载时间很长,访问者将很快离开网站。请记住,您的产品和/或服务有很多选择。我们生活在数字时代,几乎所有东西都可以在短时间内在网上找到。如果您的访问者快速离开您的网站,您的跳出率就会上升 - 让搜索引擎知道大多数人都没有找到与您相关的内容,从而降低您的搜索排名。 


第5步:避开重复内容

重复内容是指在多个位置的网络上找到的内容。通常,它位于带URL的位置。谷歌和其他搜索引擎将难以确定哪个版本的重复内容与任何给定的搜索查询更相关,这就是为什么建议完全避免重复内容。他们不知道哪些版本要包含在他们的索引中,以及他们是否应该将链接指标(如权限,链接权益等)指向您的版本或其他版本。 

在一天结束时,最好避免重复内容。除了混淆搜索引擎外,重复内容还会降低抓取工具通过您网站的频率。如果您使用营销公司提供的联合博客服务,请让他们确保内容不可抓取。 


你还能做什么? 

如果您已完成上述步骤列表,并且仍在寻找更多提高可抓取性和可搜索性的方法,那么您可以利用一些更高级的技术。但是,当然,在深入研究更多技术选项之前,您需要先从上面列出的基础知识开始。 


额外提示#1:保持Redirects Limited

URL重定向(也称为URL转发)是一种Web服务器功能,它将访问者从他们键入/访问过的URL发送到另一个URL。这些通常通过HTTP协议中定义的一系列状态代码自动执行。这些通常用于更改商家名称,两个网站之间的合并,分割测试着陆页的努力以及各种其他原因。每个页面应该只有一个重定向,以获得最佳结果。如果需要使用重定向,则始终使用302进行临时重定向,使用301进行永久重定向。 


额外提示#2:启用压缩 

压缩用于允许您的网络服务器提供较小的尺寸,因为它们可以更快地为访问您网站的用户加载。通常,gzip压缩将作为标准做法启用。如果不是这样,您的网页可能加载速度相当慢,特别是与您的竞争对手相比。启用压缩的目标是尽可能消除不必要的数据。只要不可能,请尝试使用工具压缩内容/缩小文件大小。有很多很棒的工具,例如Brotli,可以帮助您实现这一目标。 


额外提示#3:优化所有图像

对于平均网页,图像占用的大小约为60%。这可以显着降低您的加载速度,因此在可能的情况下,尝试消除不必要的图像资源,并确保它们始终被压缩,调整大小和缩放以适应它们的任何位置。正确使用图像的其他一些最佳做法包括: 

  • 使用与页面相关的唯一图像

  • 瞄准最高质量的格式

  • 为每张图片添加易于理解的标题

  • 利用“替代文字”来确保可访问性 


额外提示#4:观看内容的大小

首先是指访问者一旦登陆页面就会看到的任何内容。这可以包括图像,表单,文本和其他内容,以便在需要向下滚动页面之前吸引注意力。花一些时间考虑一下他们到达您的网站后您希望别人看到的内容。请记住,这个位置是将它们保留在页面上的关键。把你在这里提供的最有趣或最引人注目的信息。此外,请确保组织HTML标记以快速呈现任何内容。这意味着您应确保内容不超过148kB(压缩)。  


额外提示#5:设置缓存策略

通过网页缓存,您可以缩短网页的加载时间,从而降低访问者的跳出率,从而改善搜索引擎的网站。谷歌透露,加载时间的半秒差异可以将网络流量减少多达20%。出于这个原因,许多搜索引擎认为页面加载时间是决定如何对您的网站进行排名的一个非常重要的因素。确保您正在设置缓存策略,其中使用浏览器缓存来控制浏览器缓存响应的时间。您还可以使用etags确保启用有效的重新验证。 


额外提示#6:缩小资源

缩小资源 - 从图像到视频HTML到CSS再到JavaScript文件 - 涉及删除空间,选项卡,注释和其他非必要的代码。这是另一种用于加快网站加载速度的策略。如果您在WordPress上运行您的网站,请尝试在W3 Total Cache插件中找到的缩小设置。您还可以使用专门用于缩小的工具。有许多可用的,例如Google的用于JavaScript的Closure Compiler,用于HTML的HTML缩小器等等。 


结论 

有许多方法可以提高网站的可抓取性和可索引性。记住; 您的网站永远不应该是一种“一劳永逸”的资产类型。您需要不断优化和管理您的网站,以便在搜索排名中做出正确的改进。一旦您处理了阻止搜索引擎抓取和索引网页的任何问题,请将上述提示付诸实践,以便开始看到一些真实的结果。 

寒枫总监

来电咨询

18868949445

微信咨询

寒枫总监

TOP