搜索引擎是如何收录你的网站
提起搜索引擎,相信大家立马能想到百度和Goolge,作为日常网络生活的工具,他们必不可少,正是有了它们,我们才能在这漫无边际的信息海洋中找到自己感兴趣的知识;我们如此依赖它们,但你知道它们是如何工作的吗,作为网站运营者,你知道搜索引擎是如何收录你的网站吗?
其实简要的说,搜索引擎按照以下三个基本步骤来生成基于网页的结果
一,抓取网页
第一步是找出网络上存在哪些网页。由于没有所有网页的中央注册表,因此 Google 必须不断搜索新网页并将其添加到已知网页列表中。此发现过程称为“抓取”。
搜索引擎首先要找出网络上存在的网页,并对它们进行数据采集,即按照一定的方式和要求对网络上的各种站点进行爬取,并把所获得的信息保存下来以备建立索引库和用户检索。但是收集网页只是搜索引擎的一部分工作,他们还会进行计算/分配/储存用户习惯等
凡是搜索引擎之前已经抓取某些网页就都是Goolge或者百度等搜索引擎已知的网页,并且当跟踪已知网页上指向新网页的链接时,搜索引擎顺着这些链接发现其他网页,并将它们也进行抓取,除非网站禁止蜘蛛爬虫抓取它们。当网站所有者以列表形式提交一系列网页(站点地图)供 Google或者百度抓取时,搜索引擎也会很快的对列表页面上的url进行爬取
二,编入索引
当经历过第一不抓取网页后,搜索引擎会尝试了解该网页的内容,至于为什么要了解该网页,可参考小编这篇文章《想要更好的经营网站,这几个网站指南必不可少》这个过程称为“编入索引”。搜索引擎会分析该网页的文字内容、网页上嵌入的目录图片和视频文件,亦或通过其他方式尝试了解网页。然后将这些信息存储在索引库,有一点需要注意,编入搜索引并不表示网页就会被搜索引擎展示(收录),要想查看自己网站被搜索引擎收录了多少,可通过搜索引擎高级命令 site:自己网站域名。
当然,如果想要改善将你的网页编入索引的效果,可注意以下事项:
制作简短且有意义的网页标题。
使用传达网页主题的网页标题。
使用文字(而非图片)传达内容。(尽管 Google 能够理解一些图片和视频,但相比图片和视频,文字更易于理解。如果需要使用视频和图片,您至少应酌情使用替代文本和其他属性加以注释。
三,呈现(和排名)
当浏览者通过搜索引擎输入框进行信息查找时,搜索引擎会根据许多因素尝试从其索引库中找到最相关的答案,然后将它们以一定方式显示查询结果里,相比百度,Google并会考虑其他因素(例如,考虑用户所在位置、使用的语言),以便提供最佳用户体验和最恰当的答案,同样的搜索内容,不同地区Google会提供搜索结果。
最后,要想改善网页呈现和排名效果,请注意以下事项:
提高网页加载速度,并使其适合移动设备访问。
保持网站内容的持续更新发布,避免成为僵尸站。
遵循Google或者百度的站长建议规则,这有助于确保提供良好的用户体验。