一位普通站长对于国内外搜索引擎的吐槽(有更新)

作者:Carl Zhang | 更新时间:2017-01-19 | 分类:科技

在如今的互联网络里,没有搜索引擎真的是寸步难行。站长们为了让搜索引擎收录自己的网站也是想尽方法。

其实本来是没什么大问题的,但是呢,随着用户对于隐私问题的重视以及互联网交互安全,https协议的出现,使得某些搜索引擎对于站点的收录变得好像有那么一点问题了。

本站点在16年末全面开启了https协议:

我的博客

从2017年开始,Chrome浏览器安全策略全新升级,所有https协议的站点,只要没有Mixed content,都会标记上如上图所示的安全(这里通俗的解释一下什么是mixed content:就是本身站点是开启https协议的,但是呢,该网页内存在http协议的请求,比如获取http协议的视频,图片等)。而普通http协议的站点,这是一个感叹号。对于http协议的,需要用户输入银行卡信息的站点,则会直接提示不安全。

现在各大虚拟空间/云服务器供应商(例如百度云,阿里云,腾讯云等)都提供了免费的赛门铁克SSL证书,方便个人站长开启https协议。当然了,大部分的虚拟空间是不支持安装SSL证书的,云服务器是基本上都支持安装SSL的。

国内的部分网站最近也已经全面启用了的https,比如你看到的某度一定是这样的:

百度

当然,Google这个并不存在的网站很早就开启https了。说段题外话:其实说实话,互联网技术国内落后于国外不知道多少了。不说https,单说网银的用户体验,至少英国巴克莱的就甩国内各大银行几条街了,而国内的银行还都拘束于IE浏览器的技术下。再看看国内的这些个视频网站,只有腾讯视频目前是开启https的,只有优酷目前采用了flash和html5的播放器(可能还有个别几个站点有H5播放器)。国内的这些个视频网站似乎都把重点放在了如何防止用户使用广告屏蔽插件,如何圈用户的钱来开会员。用了一年YouTube这个同样并不存在的网站以后,回国以后用国内的这些视频网站,真心不想用。题外话有点长了,扯回来。本文主要是吐槽搜索引擎的,以上只不过是自己的一些牢骚而已。

不得不说, Google对于https站点的收录是真的很良心,sitemap上的站点基本都收录了,下图就是 Google收录的本站点:

google_search

可以看到所有收录的都已经变成https了,而且更新的非常快,前几天刚发布的网页,更新了sitemap以后,没几天就收录了。

附上Google的站长平台链接:https://www.google.com/webmasters/tools/home?hl=zh-CN

再来看看微软的Bing搜索:

bing_search

虽然还是有部分http的站点,但是大部分都已经转为https了。不过Bing的收录并没有 Google这么全面,这么迅速,页面数量还是停留在比较早的阶段。

微软的站长平台链接:http://www.bing.com/toolbox/webmaster/

雅虎的搜索因为一直跟Bing有着合作关系,虽然从2015年开始有所更改,但是总体内容跟Bing还是差不多,而且我也没有找到雅虎有站长平台的,所以这里就不吐槽他了。

国外的两个主流搜索引擎差不多就提这么多,因为确实对于https的收录还不错,接下来看看国内的这些个搜索引擎,其实我很不想评价,因为很伤。大家自己看图吧:

百度:

baidu_search

呦,之前刚开https的时候那个阶段收录直接从20降为0,今天搜一下居然又有了。但是可以看到所有网站都是http协议,并没有变成https。而且网页均为未开启https时收录的,开启https以后再无新网页收录。

360:

360_search

360是让我最失望的,一开始没开https的时候,360是国内搜索引擎中收录我的站点最多的,所以我的站点的站内搜索我选择了360而不是百度,虽然现在这个站内搜索框还留在首页,但是实际上已经没有用了,啥都搜不到。

而且,自从开启了https以后,360搜索的站长平台上,提交的sitemap永远显示包含Url为0:

360_sitemap

我觉得它左上角那个微笑表达了深深地恶意!

搜狗:

sougou_search

sougou_search

搜狗的收录一直就只有首页,开启https以后就直接没了。而且搜狗的站长平台是不能提交sitemap的。

其实一开始对于百度的https收录是心存幻想的,因为:

baidu_https

而且在百度的站长平台上是可以提交https的链接的。然而当我提交了https协议的sitemap以后,无论提交多少次显示的都是:

baidu_https

抓取失败???Excuse me???说好的https优先收录呢???此时心中一万只草泥马策马奔腾。然后就跑去本站点的服务器供应商(百度云)提交工单,想想自家公司的产品,应该会了解吧,于是我得到了这个回应:

baidu_ticket

哈???会有点问题是啥???所以说之前那个说的https优先收录是扯淡咯?百度这是自己人打自己人的脸啊。我的天哪,我可能用了假的百度。

(1月20日更新:经过测试,发现百度站长平台的sitemap提交链接改为http://就不会出现抓取失败的问题了,至于后期是否会收录,我过段时间再来更新这篇博客。360站长平台此方法是否有效还在观察中。)

sitemap_baidu_new

为了证明这个锅不是我sitemap地址的问题,附上 Google和Bing站长平台的sitemap提交页面截图:

sitemap_google

sitemap_bing

哎,国内的大众搜索引擎跟国外的大众搜索引擎差的还是有点多啊,Google退出大陆市场这么多年,或许给百度一种自己是国内搜索引擎界大哥的错觉,希望能够慢慢跟上来吧。

(本文为作者原创。转载请注明:转自carlzhang.net