正在读取数据,页面载入中,请稍后...

事实证明:蜘蛛是抓取不到JS的

蜘蛛会爬取JS、识别JS、抓取JS、读取JS、执行JS、打开JS、嵌入JS文件,但是,蜘蛛不会根据 window.location.href 直接跳转。比如,下面的代码,蜘蛛是不会跳转的。

<script>window.location.href='http://nidecms.com/';</script>

为什么蜘蛛抓取不到JS呢?下面我直接上代码,像下面的这种代码,蜘蛛是不会根据JS重新识别标题、描述、关键词的。

<!DOCTYPE>
<html>
<head>
<title>网站标题</title>
<meta name="keywords" content="关键词"/>
<meta name="description" content="网站描述"/> 
</head>
<body>
</body>
</html>
<script type="text/javascript">
document.title = "JS更改原网站标题";
document.querySelector('meta[name="keywords"]').setAttribute('content', "JS更改原关键词");
document.querySelector('meta[name="description"]').setAttribute('content', "JS更改原网站描述");
</script>

看起来高端,但又没有啥用的代码。这段代码,我在网站用过。经测试,蜘蛛真的是抓取不到,收录的全是网站标题。

还有一个就是,最近比较流行的,JS中英互译插件。尽管可以设置中文、英文、繁体、日语、韩文、甚至多国语言互译等,但是,蜘蛛只会抓取HTML本身的代码。

本文结束

评论专区

发表评论

评论列表(无评论)