正在读取数据,页面载入中,请稍后...

火车头采集无列表页的文章内容

这年头,好多的站长,整出来的网站,都不喜欢整列表页了。对于那些,只喜欢循规蹈矩的,使用火车头的小伙伴,真的是难得头都大了,这站长把小白都整懵了。
下面,小千教大家,即使没有列表页,那我们就制造个列表页,这样就阔以愉快的采集了。

教程开始

新建一个 index.php 代码如下

<?php 
error_reporting(0);//不显示错误
set_time_limit(0);//永不超时
header('Content-type:text/html;charset=utf-8');
header('HTTP/1.1 200 Moved Permanently');
ob_start('ob_gzhandler');
?>
<!DOCTYPE HTML>
<html>
<!--STATUS OK-->
<head>
<title>全民博客</title>
</head>
<body>
<div class="kakaa">
<?php
for ($i=1;$i<=20;$i++) {
	echo '<li><a href="http://www.xxxxx.com/'.$i.'.html">'.$i.'</a></li>';
}
?>
<div>
</body>
</html>

比如:采集 xxxxx.com 网站的文章,从 /1.html 到 /20.html 的链接,这样就可以直接的采集了。但是,没有谁的网站,就那么几篇的文章,还值得我们这样的折腾。废话少说了,直接上今天的重点代码。

代码开始

上面的那个,只是试试水的,完全可以不要。新建一个 index.php 代码如下

<?php 
error_reporting(0);//不显示错误
set_time_limit(0);//永不超时
header('Content-type:text/html;charset=utf-8');
header('HTTP/1.1 200 Moved Permanently');
ob_start('ob_gzhandler');
?>
<!DOCTYPE HTML>
<html>
<!--STATUS OK-->
<head>
<title>全民博客</title>
</head>
<body>
<?php
$pages = isset($_GET['page']) ? $_GET['page'] : 1; // 获取当前页数,默认为第一页
$aaage = 20;/*开始数*/
$total = 250;/*结束数*/
$perge = 20;/*每页显示的数据条数*/
$totas = ceil(($total-$aaage+1) / $perge);/*分页总数*/
$start = ($pages - 1) * $perge + $aaage;
$endet = $start + $perge - 1;/*结束的数据条数*/
echo '<div class="kakaa">'."\n";
for ($a = $start; $a <= $endet; $a++) {
	$v = $a;
	if($v <= $total) {
		echo '<a href="http://www.xxxxx.com/'.$v.'.html">'.$v.'</a>'."\n";
	}
}
echo "<div><br>当前分页: ".$pages.' 分页总数: '.$totas.'<br><div class="pages">'."\n";
for ($i = 1; $i <= $totas; $i++) {
	if ($i == $pages) {
		echo '<a style="color:#f72e41;">['.$i.']</a> ';
	} else {
		echo '<a href="http://'.$_SERVER['HTTP_HOST'].'/?page='.$i.'">'.$i.'</a>'."\n";
	}
}
echo '<div>';
?>
</body>
</html>

这个代码,就齐活了,满足需求了。无论你的网站,有多少篇文章,我可以分页显示,而且,我还可以,从某个ID开始,再到某个ID结束。

怎么使用

肯定是使用 phpstudy_pro 搭建本地环境,如果是Win10系统的,使用宝塔面板搭建本地环境,反正就是本地环境访问,没列表就造个列表就能采集了。

上网冲浪

最近,李某某说:以后不会存在程序员这种职业了!

其实吧,我想说,就算AI助手再牛哔,它不也是程序员开发出来的吗。
开发出来后,也是需要维护、运营、更新、升级的啊。
李某某扬言断定未来,未来再也没有程序员,这是来自,站在金字塔顶端的人说出来的话?
网络公司,不要程序员,没有程序员,我信你个鬼,你公司再大,靠你一个人能够扛起吗?你不也还在招程序员吗?哎,嘲笑、讥讽、忽悠、舆论、只为引流而制造的话题。

李某某:说你没用,你急也没用,你看你还急了,我就是能为所欲为,因为你做的网站,都被我拿来训练AI了。

番外教程

最近研究发现,其实在火车头中,这种有规律的内容页命名,是可以直接采集文章页的。如下图所示

火车头采集无列表页的文章内容 - 全民博客

火车头采集无列表页的文章内容 - 全民博客

火车头采集无列表页的文章内容 - 全民博客

火车头采集无列表页的文章内容 - 全民博客

就这样就好了,玩了个寂寞啊。

本文结束

评论专区

发表评论

评论列表(无评论)