蜘蛛会爬取JS、识别JS、抓取JS、读取JS、执行JS、打开JS、嵌入JS文件,但是,蜘蛛不会根据 window.location.href 直接跳转。比如,下面的代码,蜘蛛是不会跳转的。
<script>window.location.href='http://nidecms.com/';</script>
为什么蜘蛛抓取不到JS呢?下面我直接上代码,像下面的这种代码,蜘蛛是不会根据JS重新识别标题、描述、关键词的。
<!DOCTYPE> <html> <head> <title>网站标题</title> <meta name="keywords" content="关键词"/> <meta name="description" content="网站描述"/> </head> <body> </body> </html> <script type="text/javascript"> document.title = "JS更改原网站标题"; document.querySelector('meta[name="keywords"]').setAttribute('content', "JS更改原关键词"); document.querySelector('meta[name="description"]').setAttribute('content', "JS更改原网站描述"); </script>
看起来高端,但又没有啥用的代码。这段代码,我在网站用过。经测试,蜘蛛真的是抓取不到,收录的全是网站标题。
还有一个就是,最近比较流行的,JS中英互译插件。尽管可以设置中文、英文、繁体、日语、韩文、甚至多国语言互译等,但是,蜘蛛只会抓取HTML本身的代码。
本文结束
评论专区
发表评论
评论列表(无评论)