您的位置 首页 编程知识

Scrapy CrawlSpider 中 deny 设置为何无效?

scrapy crawider 中的 deny 设置为何无效 问题中提到的 deny 设置无效是因为 deny…

Scrapy CrawlSpider 中 deny 设置为何无效?

scrapy crawider 中的 deny 设置为何无效

问题中提到的 deny 设置无效是因为 deny 参数的值没有采用正则表达式。

在 scrapy 的 crawlspider 中,deny 参数用于指定不应被爬取的 url 模式。如果 deny 参数没有使用正则表达式,那么它只能够匹配完全相等的 url。

因此,如果希望 deny 参数能够匹配包含特定字符串的 url,就需要使用正则表达式。例如,如果要拒绝包含 “guba” 字符串的 url,可以将 deny 参数设置为以下正则表达式:

deny=(r'.*guba.*',)
登录后复制

以上就是Scrapy CrawlSpider 中 deny 设置为何无效?的详细内容,更多请关注php中文网其它相关文章!

本文来自网络,不代表四平甲倪网络网站制作专家立场,转载请注明出处:http://www.elephantgpt.cn/3321.html

作者: nijia

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

18844404989

在线咨询: QQ交谈

邮箱: 641522856@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部