• 首页
  • 站长新闻
  • 经验心得
  • 新手教程
  • 营销策划
  • 搜索&SEO
  • 创业
  • 互联网
  • 电子商务
  • 专题
  • 世界新闻
  • 当前位置: 云商网主页 > 专题 > 文章详细内容

    360搜索继“悟空算法”后上线“后羿算法”保护原创

    2016-12-26 - 专题 - 阅读: -作者:admin -加小编V信:hxw700   我要投稿

    互联网的快速开展离不开原创和稀缺的优质原创资源。但采集网站采取猖獗而低劣的手腕,短时间内拼凑出大量低质量网页,不只严重影响了用户的阅读体验,也极大挫伤原创作者和原创网站的积极性。近日,360搜索发布站长公告,宣布上线后羿算法,对低劣的采集站点加以控制,对原创和稀缺性网页停止维护和提权,与站长共同建立良好的互联网生态环境。

      “原创+转载+信息分类聚合”曾经成为互联网新闻网站的最常见内容产出形式,比方新浪、搜狐、网易这些传统门户,和今日头条等挪动APP。原创内容保证了网站的共同性,而转载内容保证网站信息的足够全面,大量的分类聚合工作,让互联网信息条理分明类目清楚。

      网站之间常规的转载,请求转载网站在醒目位置列出文章出处和原创页面入口,用户能够直接跳转到原创页面。但采集站,常常坦白或者窜改文章出处,且不分条理的自觉抓取互联网信息。为了取得流量收益,采集站会在页面中夹杂大量的广告和弹窗信息,不只糜费了搜索引擎的收录资源,损害了原创作者的版权,用户搜索体验也大打折扣。

      据估量,用户喜欢的高质量原创内容,互联网每天会降生数十万个页面,与之成鲜明比照的是,采集网站带来互联网上的冗余信息则高达上百亿个页面,与冗余信息相比,原创内容可谓九牛一毛。

      采集站的内容散布范畴十分普遍,常见的范畴有普通问答类,商品购物类,文娱新闻类,企业商情类,成人色情类,赌博诈骗类,私服外挂类,违法违禁类等,涵盖了互联网内容的各大范畴。与此同时,挪动互联网的采集和渣滓网页,固然其数量级要比PC端要低,但在行为形式方面与PC端区别不大。

      “后羿算法”倡导原创,控制歹意采集

      12月26日,360搜索发布站长公告,宣布上线抑止采集维护原创的高级算法“悟空算法”,该算法将对低劣的采集站点加以控制,对原创和稀缺性网页停止维护和提权。360搜索表示,愿与无数专心做好站的站长共同建立良好的互联网生态环境

      “后羿算法”上线后,关于内容丰厚的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展示的时机;关于滥用采集手腕的行为(如整站大范围采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展示时机和网页收录量;关于新闻网站正常的转载行为,采取了合理引导和标准控制,而不是一棒子打死。

      据悉,后羿算法采取了业界抢先的大范围并行机器学习算法,经过亿万维度特征的描写,分离对搜索范畴问题的不时探究和理论,对海量文本数据停止主题和内容倾向性剖析,对用户爱好水平停止全面建模和应用,可以对原创信息停止快速而精准的鉴别,可以对采集行为和渣滓网页停止定向的约束和管控。

      360搜索不断以来都控制着采集类站点的完好索引量和历史行为形式,并对之停止长期的亲密的关注和监控,一旦发现有恶劣作弊倾向就会停止严肃处置,用“后羿“命名该算法,就是为了秉承了英雄后羿的“去除冗余,除暴安良”精神。
    相关新闻推荐阅读:http://www.ytmer.com/7bzXz

    顶一下
    (0)
    0%
    踩一下
    (0)
    0%

    赞助链接

    赞助链接