百度大搜索业务部门对新站的不断重视,既是来势汹涌的创业潮的推动所致,也是爬虫技术对内容优秀的新站挖掘困难的结果。为此,百度站长平台正在做出更多的努力,面向新站的扶持计划 “蝶变行动” 正说明了这一点。
第一届 “蝶变行动” 举办于今年3月 份,迄今为止共 2 届,共覆盖了 1 万大几的新站。两次活动均面向上线不超过 2年 的新站,筛选优秀者给予奖励,并在 SEO、新站扶持等方面与创业者展开讨论。第 2 次活动更看重网站在移动端的建设,同时综合搜索引擎对网站的评价、内容质量、用户体验、用户投票等评选出奖项。
当然,这是一个双方受益的事情。一方面对于做网页的创业公司而言,不论是做内容还是做移动端的引流,都必须重视 SEO 优化;另一方面,百度自身也需要通过引导优秀新站的 SEO 优化,来为用户抓取优秀内容提供便利。
换句话说,创业公司更希望做出 SEO 优化行为后,能有可评估的效果立见。但百度的诉求是,创业公司做出好内容后,创业公司自身努力去适应百度的技术规则。不得不承认的是,这两种诉求的地位不可能对等,但适应规则本身也是创业公司的必备技能。
整理此次沙龙的部分干货如下:
1. 在 spider 的网页抓取上,百度从站点评价、本站链接、pattern 聚合、用户反馈等方面给出了一些建议:
(1)站点评价:指标包括时效性、原创性、权威性、用户访问友好性。这里面需要注意三点:首先,注意新域名之前是否被滥用过;其次是注意域名是不是被黑。可以使用抓取诊断工具,查看源代码,是不是被藏着小黑链;此外,不要用泛滥的域名,很多免费域名堆积了一大堆垃圾站,百度会评价聚合域名的价值,聚合的评价效果会影响小站,所以建议用比较常见或者传统的域名;
(2)本站的链接关系:过多的层级和链接对百度 Spider 来说是很不友好的,链接深度越高,价值评估越低,超链关系尽量要扁平,从首页就能够发现;优质的前链对后链收录有促进作用;时效性强的内容往前推;
(3)Pattern:Spider 抓回链接,将相似的内容聚合成 Pattern,和网页内容相似的站点会给聚和,这种聚合决定了抓取。选比较好的进行实时推送,可以形成一个较好的 Pattern;
(4)用户的反馈数据。包括点击量等,要给用户提供有价值的内容;
(5)其他: Url 长度要均匀规范。参数过多导致的长 Url,在 Spider 抓取的时候往往被认为没有价值,长尾会被 Pass 掉,不要搞无谓的参数;百度 Spider 非常不欢迎爆发式的内容增长,而且会打压。因此链接推送速度要均匀,而不是攒一堆推过来,或者复制一堆东西推过来。
2. 百度给出了 Mobile Friendly 移动友好度的标准:
移动友好度是应用于移动端检索的一套算法,用来把移动端展现好,满足移动端用户体验的结果排到靠前的位置上。主要包括页面可读性、资源 / 功能易用性、质量增益三个方面。
页面可读性指标
资源 / 功能易用性指标
页面的质量增益
质量增益相当于一个加分项,当可读性和资源功能易用性都很好的时候,百度才会考虑页面质量增益,并给予额外优待。质量增益有四点,第一访问路径增益,页面提供很好的导航和面包屑,能够去往上一级、下一级,方便用户在站内继浏览。第二是效益增益,你提供电话和地址,提供电话可拨打和地址可定位。第三是输入增益,查询类应用类网站,输入语言和图象搜索。最后是体验增益,白天、夜间模式切换,主要是大概是这四类以上,后面可能会扩充别的项记。
移动友好度算法应用是移动端的检索,不影响 PC 端的检索。
此外百度还介绍了服务于移动端的新产品 AppLink:客户接入百度 AppLink 服务,用户通过点击百度搜索结果,调起用户设备中已安装的 App,并进入内容对应界面。旨在打破移动 App 与 H5 的边界,并帮助客户提升 App日活以及转化率。对于未安装 App 的设备,链接则跳转到原 WAP 页面或 Website 页面。