纯代码实现WordPress记录搜索引擎蜘蛛爬行记录

年年有鱼

• 2019年12月21日 03:15 • Wordpress • 阅读 1293

在新站或网站收录有问题时，可能需要持续关注搜索引擎蜘蛛的抓取情况。

对于网站的内容是否能够及时的收录，都是我们站长每天都在关注的东西，每天产出的东西有限，所更加的关注自己写的内容是否能够讨的百度蜘蛛的欢心，好及时收录自己的网页，早一天收录，这样获得流量的可能性就会更多一点，那样的话，以后变现的成本也会变得更低。

有时候当我们不知道蜘蛛什么时候来过我们的网站的时候，只能够通过一遍又一遍的向百度提交自己网站最近产生的新鲜内容。

但是又害怕这样会让百度的蜘蛛讨厌我们的网站，总之那种感觉啊，不是太好。

每次打开服务器端访问日志查看非常麻烦，特别是当日志文件比较大时更是不便。

最好的办法就是在线直接打开看蜘蛛爬行记录。

为此，我们可以免插件使用纯代码来实现这个功能。

PHP代码

// 记录蜘蛛访问记录    <br>
    function get_naps_bot(){  <br>
    $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);  <br>
    if (strpos($useragent, 'googlebot') !== false){  <br>
    return 'Googlebot';  <br>
    }  <br>
    if (strpos($useragent, 'bingbot') !== false){  <br>
    return 'Bingbot';  <br>
    }  <br>
    if (strpos($useragent, 'slurp') !== false){  <br>
    return 'Yahoobot';  <br>
    }  <br>
    if (strpos($useragent, 'baiduspider') !== false){  <br>
    return 'Baiduspider';  <br>
    }  <br>
    if (strpos($useragent, 'sogou web spider') !== false){  <br>
    return 'Sogouspider';  <br>
    }  <br>
    if (strpos($useragent, 'haosouspider') !== false){  <br>
    return 'HaosouSpider';  <br>
    }  <br>
    if (strpos($useragent, 'yodaobot') !== false){  <br>
    return 'YodaoBot';  <br>
    }  <br>
    return false;  <br>
    }  <br>
    function nowtime(){  <br>
    date_default_timezone_set('Asia/Shanghai');  <br>
    $date=date("Y-m-d G:i:s");  <br>
    return $date;  <br>
    }  <br>
    $searchbot = get_naps_bot(); <br>
    if ($searchbot) {  <br>
    $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);  <br>
    $url=$_SERVER['HTTP_REFERER']; <br>
    $addr=$_SERVER['REMOTE_ADDR']; <br>
    $file="robotslogs.txt";  //根目录下记录蜘蛛访问的文件<br>
    $time=nowtime();  <br>
    $data=fopen($file,"a");  <br>
    $PR="$_SERVER[REQUEST_URI]";  <br>
    fwrite($data,"[$time] - $addr - $PR - $searchbot $tlc_thispage \r\n");  <br>
    fclose($data);  <br>
    }

将以上代码插入 funtion.php 文件，并在网站根目录下创建一个名为 robotslogs.txt 的文件即可，文件名可自定义。

需将 robotslogs.txt 设置为最好是 777 权限。

以上代码能记录搜索蜘蛛的基本抓取信息，完成以后，一般 24 小时候，就可以看到你“robotslogs.txt”当中已经满是数据的了。

本文来自【年年有鱼】的投稿，部分内容可能来源于互联网，不代表【最省事】的观点和立场。侵权投诉>>

本文著作权归博主所有，并授权【最省事】独家使用，未经博主授权，请勿转载。授权申请>>

AI智能助理 2025年3月5日

群晖MailPlus是一种由群晖（Synology）开发的邮件服务器软件，主要针对NAS设备设计的。它支持跨平台的邮件客户端（包括Webmail、iOS和Android），提供专业的企业级邮件服务器功能，如智能邮件过滤和垃圾邮件防护、多域名管理等。通过MailPlus，用户可以方便地管理邮件服务器，…

评论于干货丨手把手教会群晖Mailplus设置及邮件免拒收（SPF、DMARC、DKIM）
年年有鱼 2025年3月5日

群晖Mailplus是什么？

评论于干货丨手把手教会群晖Mailplus设置及邮件免拒收（SPF、DMARC、DKIM）
AI智能助理 2025年3月2日

群晖VMM，全名是群晖虚拟机管理器（Virtual Machine Manager），是群晖NAS系统里的一个功能模块。简单来说，它就是一个虚拟化平台，让你可以在NAS上运行多个虚拟机。用这个工具，你可以像在电脑上安装操作系统一样，安装Windows、Linux等系统到你的群晖NAS上。这样你就可…

评论于用群晖VMM体验统信UOS国产桌面操作系统

纯代码实现WordPress记录搜索引擎蜘蛛爬行记录

PHP代码

关于作者

年年有鱼责任编辑

发表回复

纯代码实现WordPress记录搜索引擎蜘蛛爬行记录

PHP代码

关于作者

年年有鱼责任编辑

相关推荐

Brydge推出专为Surface而设计的无线键盘和独立触控板

纯代码实现WooCommerce商品（产品）页固定链接html后缀

资源号为何频频“迁移”：买卖趁早粉丝不少

WordPress主题前台页面添加用户头像

丰田入局阿波罗，百度自动驾驶或将迎来商业元年？

锤子手机启示录之：做产品与做企业

发表回复