这年头,好多的站长,整出来的网站,都不喜欢整列表页了。对于那些,只喜欢循规蹈矩的,使用火车头的小伙伴,真的是难得头都大了,这站长把小白都整懵了。
下面,小千教大家,即使没有列表页,那我们就制造个列表页,这样就阔以愉快的采集了。
教程开始
新建一个 index.php 代码如下
<?php error_reporting(0);//不显示错误 set_time_limit(0);//永不超时 header('Content-type:text/html;charset=utf-8'); header('HTTP/1.1 200 Moved Permanently'); ob_start('ob_gzhandler'); ?> <!DOCTYPE HTML> <html> <!--STATUS OK--> <head> <title>全民博客</title> </head> <body> <div class="kakaa"> <?php for ($i=1;$i<=20;$i++) { echo '<li><a href="http://www.xxxxx.com/'.$i.'.html">'.$i.'</a></li>'; } ?> <div> </body> </html>
比如:采集 xxxxx.com 网站的文章,从 /1.html 到 /20.html 的链接,这样就可以直接的采集了。但是,没有谁的网站,就那么几篇的文章,还值得我们这样的折腾。废话少说了,直接上今天的重点代码。
代码开始
上面的那个,只是试试水的,完全可以不要。新建一个 index.php 代码如下
<?php error_reporting(0);//不显示错误 set_time_limit(0);//永不超时 header('Content-type:text/html;charset=utf-8'); header('HTTP/1.1 200 Moved Permanently'); ob_start('ob_gzhandler'); ?> <!DOCTYPE HTML> <html> <!--STATUS OK--> <head> <title>全民博客</title> </head> <body> <?php $pages = isset($_GET['page']) ? $_GET['page'] : 1; // 获取当前页数,默认为第一页 $aaage = 20;/*开始数*/ $total = 250;/*结束数*/ $perge = 20;/*每页显示的数据条数*/ $totas = ceil(($total-$aaage+1) / $perge);/*分页总数*/ $start = ($pages - 1) * $perge + $aaage; $endet = $start + $perge - 1;/*结束的数据条数*/ echo '<div class="kakaa">'."\n"; for ($a = $start; $a <= $endet; $a++) { $v = $a; if($v <= $total) { echo '<a href="http://www.xxxxx.com/'.$v.'.html">'.$v.'</a>'."\n"; } } echo "<div><br>当前分页: ".$pages.' 分页总数: '.$totas.'<br><div class="pages">'."\n"; for ($i = 1; $i <= $totas; $i++) { if ($i == $pages) { echo '<a style="color:#f72e41;">['.$i.']</a> '; } else { echo '<a href="http://'.$_SERVER['HTTP_HOST'].'/?page='.$i.'">'.$i.'</a>'."\n"; } } echo '<div>'; ?> </body> </html>
这个代码,就齐活了,满足需求了。无论你的网站,有多少篇文章,我可以分页显示,而且,我还可以,从某个ID开始,再到某个ID结束。
怎么使用
肯定是使用 phpstudy_pro 搭建本地环境,如果是Win10系统的,使用宝塔面板搭建本地环境,反正就是本地环境访问,没列表就造个列表就能采集了。
上网冲浪
最近,李某某说:以后不会存在程序员这种职业了!
其实吧,我想说,就算AI助手再牛哔,它不也是程序员开发出来的吗。
开发出来后,也是需要维护、运营、更新、升级的啊。
李某某扬言断定未来,未来再也没有程序员,这是来自,站在金字塔顶端的人说出来的话?
网络公司,不要程序员,没有程序员,我信你个鬼,你公司再大,靠你一个人能够扛起吗?你不也还在招程序员吗?哎,嘲笑、讥讽、忽悠、舆论、只为引流而制造的话题。
李某某:说你没用,你急也没用,你看你还急了,我就是能为所欲为,因为你做的网站,都被我拿来训练AI了。
番外教程
最近研究发现,其实在火车头中,这种有规律的内容页命名,是可以直接采集文章页的。如下图所示
就这样就好了,玩了个寂寞啊。
本文结束
评论专区
发表评论
评论列表(无评论)