WordPress发布文章即时推送到百度,加快百度收录

 更新时间:2015-06-29 15:46:20   作者:佚名   我要评论(0)

百度已经出了一个“主动推送将逐步取代实时推送,实时向百度推送新数据”的功能,我们可以为自己的 WordPress 实现发布文章马止就推送到百度上去。一、主动推送先来看下百度

百度已经出了一个“主动推送将逐步取代实时推送,实时向百度推送新数据”的功能,我们可以为自己的 WordPress 实现发布文章马止就推送到百度上去。

一、主动推送

先来看下百度对于主动推送的一些说明:

    主动推送:最为快速的提交方式,建议您将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。

    主动推送支持多种途径:比如curl 、post、php以及ruby等。而且支持一次性提交多条网站页面地址,不过每个站点每天可推送的次数暂时限制在50次。
    使用主动推送功能会达到怎样效果?
    ①、及时发现:可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录
    ②、保护原创:对于网站的最新原创内容,使用主动推送功能可以快速通知到百度,使内容可以在转发之前被百度发现

    ——摘自百度官方:原文地址

二、PHP代码

WordPress发布文章主动推送到百度的代码非常简单,只要稍微修改一下张戈博客之前分享的《WordPress发布文章自动同步到新浪微博(带特色图片)》中的代码即可搞定:
/**
* WordPress发布文章主动推送到百度,加快收录保护原创
* 文章地址:http://zhangge.net/5041.html
*/
if(!function_exists('Baidu_Submit') && function_exists('curl_init')) {
    function Baidu_Submit($post_ID) {
        $WEB_SITE='zhangge.net'; //这里换成你的首选域名
        $WEB_TOKEN='xxxxxxxxx';  //这里换成你的网站的百度主动推送的token值
        //已成功推送的文章不再推送
        if(get_post_meta($post_ID,'Baidusubmit',true) == 1) return;
        $url = get_permalink($post_ID);
        $api = 'http://data.zz.baidu.com/urls?site='.$WEB_SITE.'&token='.$WEB_TOKEN;
        $ch  = curl_init();
        $options =  array(
            CURLOPT_URL => $api,
            CURLOPT_POST => true,
            CURLOPT_RETURNTRANSFER => true,
            CURLOPT_POSTFIELDS => $url,
            CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),
        );
        curl_setopt_array($ch, $options);
        $result = json_decode(curl_exec($ch),true);
        //如果推送成功则在文章新增自定义栏目Baidusubmit,值为1
        if (array_key_exists('success',$result)) {
            add_post_meta($post_ID, 'Baidusubmit', 1, true);
        }
    }
    add_action('publish_post', 'Baidu_Submit', 0);
}

/**
* WordPress发布文章主动推送到百度,加快收录保护原创
* 文章地址:http://zhangge.net/5041.html
*/
if(!function_exists('Baidu_Submit') && function_exists('curl_init')) {
    function Baidu_Submit($post_ID) {
        $WEB_SITE='zhangge.net'; //这里换成你的首选域名
        $WEB_TOKEN='xxxxxxxxx';  //这里换成你的网站的百度主动推送的token值
        //已成功推送的文章不再推送
        if(get_post_meta($post_ID,'Baidusubmit',true) == 1) return;
        $url = get_permalink($post_ID);
        $api = 'http://data.zz.baidu.com/urls?site='.$WEB_SITE.'&token='.$WEB_TOKEN;
        $ch  = curl_init();
        $options =  array(
            CURLOPT_URL => $api,
            CURLOPT_POST => true,
            CURLOPT_RETURNTRANSFER => true,
            CURLOPT_POSTFIELDS => $url,
            CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),
        );
        curl_setopt_array($ch, $options);
        $result = json_decode(curl_exec($ch),true);
        //如果推送成功则在文章新增自定义栏目Baidusubmit,值为1
        if (array_key_exists('success',$result)) {
            add_post_meta($post_ID, 'Baidusubmit', 1, true);
        }
    }
    add_action('publish_post', 'Baidu_Submit', 0);
}

先将代码中的 “zhangge.net”替换为你网站首选域名,然后打开百度官方页面:http://zhanzhang.baidu.com/linksubmit/index,获取你网站的专属的token值,替换到代码中的 "xxxxxxxxx"。


最后将修改后的代码添加到主题目录下的 functions.php 函数模板并保存。

现在发布新文章,文章地址将会被主动推送到百度。被成功推送的文章,将自动出现如下自定义栏目:


从而避免代码重复推送的尴尬,如果你需要更新文章再次推送数据,那么删除或修改这个自定义栏目即可再次被推送。

Ps:虽然,主动推送的各种方法都支持一次推送多条数据,从我个人的经验来看,对于老文章没必要再次推送,频繁推送容易导致百度“翻脸”!

三、其他说明

用心思考的童鞋,应该可以看出百度的目的应该是为了获取文章准确的发布时间,这一项改进很明显就是为了配合之前百度取消快照之后,新增的“文章发布时间"的改动:

我个人认为,之前百度应该是通过分析文章中的时间戳来确认原创文章的发布时间。但是时间戳是可以作弊的,而百度蜘蛛的抓取也不是及时的,这样就带来了文章是否真实原创的争议!比如张戈博客发布一篇文章,蜘蛛还没来得及抓取,就被大站转走而且还不带来源链接,就会出现一种情况:大站的蜘蛛抓取频繁,第一时间就抓到了转载的文章,认为是原创,而真正的原创却由于后抓取被蜘蛛认为是伪原创!是个人都要吐血了吧?

现在有了主动推送就好多了,高质量原创文章发布,第一时间就会推送到百度,从而告知了最准确的原创来源,从而杜绝了抄袭者和原创者出现角色互换的尴尬!还在使用老版 baidusubmit 插件的朋友,可以赶紧试试代码了!

最新补充:早上不经意看到百度官方推荐文章,果然不出我所料:

    新的主动推送工具最大的亮点就是“快”。
    这个工具直接将链接推送给百度,而原来的工具推送的是结构化数据,需要百度进一步解析和内部排序。天下功夫,唯快不破。高手对决中,1微秒决定胜负。快速推送带来的好处是两方面的:一是及时发现,可以缩短百度爬虫发现您站点新链接的时间,使新发布的页面可以在第一时间被百度收录;二是保护原创,对于网站的最新原创内容,使用主动推送功能可以快速通知到百度,使内容可以在转发之前被百度发现。

    新的主动推送工具第二个特点就是“人性化”。
    首先是密匙的人性化,同一个帐号下所有站点的密匙相同。这一点对于一个绑定了多个子域名的大站来说,是个福音,不用为每个子域名写个推送程序,节省时间成本和技术成本。第二个人性化是返回数据人性化,返回数据包含返回码和message,推送完后能立即知道推送结果,而老的工具推送后要登录后台才能查看推送结果。

    另外,使用这个插件时必须确保推送的是最新、高质量的网页链接。
      刚才说新工具的最大亮点是快,之所以能快,是因为跳过了正常抓取时的好几个步骤。百度这样做,是希望能更加快速的抓取到高质量的网页。如果一个网站经常推送一些老的、垃圾页面的链接,百度会很生气的,会认为网站辜负了他的信任,直接后果是百度不再信任这个网站的推送,导致工具失效,是否有其它更恶劣的后果,比如降低网站评价,这个还有待进一步观察。所以,使用这个工具时一定要注意,老的、低质量的网页链接不要推送了。(Ps:为了测试我的代码,我连续推送了十几次老文章,也是醉了。。。)

然后这位仁兄还给出了主动推送和实时推送的对比清单:


不久,我又在百度官方WIKI看到了相关文章,已更新到上文当中 。


相关文章

  • 深入理解nodejs搭建静态服务器(实现命令行)

    深入理解nodejs搭建静态服务器(实现命令行)

    静态服务器 使用node搭建一个可在任何目录下通过命令启动的一个简单http静态服务器 完整代码链接 安装:npm install yg-server -g 启动:yg-server
    2019-02-06
  • 详解webpack编译速度提升之DllPlugin

    详解webpack编译速度提升之DllPlugin

    一、前言 The DllPlugin and DllReferencePlugin provide means to split bundles in a way that can drastically improve build time performance. DllPlu
    2019-02-06
  • Vue从TodoList中学父子组件通信

    Vue从TodoList中学父子组件通信

    简单的 TodoList 实现一个简单的 todolist,当我输入内容后,点击提交自动添加在下面,如下图所示: 用代码实现这个效果: <div id="app"> <input ty
    2019-02-06
  • Tensorflow分类器项目自定义数据读入的实现

    Tensorflow分类器项目自定义数据读入的实现

    在照着Tensorflow官网的demo敲了一遍分类器项目的代码后,运行倒是成功了,结果也不错。但是最终还是要训练自己的数据,所以尝试准备加载自定义的数据,然而d
    2019-02-06
  • ES6 对象的新功能与解构赋值介绍

    ES6 对象的新功能与解构赋值介绍

    ES6 通过字面量语法扩展、新增方法、改进原型等多种方式加强对象的使用,并通过解构简化对象的数据提取过程。 一、字面量语法扩展 在 ES6 模式下使用字
    2019-02-06
  • Redis连接错误的情况总结分析

    Redis连接错误的情况总结分析

    前言 最近由于流量增大,redis 出现了一连串错误,比如: LOADING Redis is loading the dataset in memory use of closed network connection connec
    2019-02-06
  • 使用TensorFlow实现二分类的方法示例

    使用TensorFlow实现二分类的方法示例

    使用TensorFlow构建一个神经网络来实现二分类,主要包括输入数据格式、隐藏层数的定义、损失函数的选择、优化函数的选择、输出层。下面通过numpy来随机生成一
    2019-02-06
  • PHP实现字符串大小写转函数的功能实例

    PHP实现字符串大小写转函数的功能实例

    字符串的大小写转换功能在日常中经常使用。那么如何实现一个简单的大小写转换功能呢&#63; 在php中,最终使用的是c语言的toupper,tolower函数将字符进行大小写
    2019-02-06
  • Nginx代理时header头中带"_"信息丢失问题的解决

    Nginx代理时header头中带"_"信息丢失问题的解决

    前言 开发网关项目时,在请求时往请求头header中放入了签名sign_key信息,在接收请求时再从header中拿出,在本地调试时是可以的,但上线之后通过Nginx代理之后
    2019-02-06
  • Python实现E-Mail收集插件实例教程

    Python实现E-Mail收集插件实例教程

    __import__函数 我们都知道import是导入模块的,但是其实import实际上是使用builtin函数import来工作的。在一些程序中,我们可以动态去调用函数,如果我们
    2019-02-06

最新评论