Python使用scrapy采集時偽裝成HTTP/1.1的方法
來源:懂視網
責編:小采
時間:2020-11-27 14:39:51
Python使用scrapy采集時偽裝成HTTP/1.1的方法
Python使用scrapy采集時偽裝成HTTP/1.1的方法:本文實例講述了Python使用scrapy采集時偽裝成HTTP/1.1的方法。分享給大家供大家參考。具體如下: 添加下面的代碼到 settings.py 文件 代碼如下:DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactor
導讀Python使用scrapy采集時偽裝成HTTP/1.1的方法:本文實例講述了Python使用scrapy采集時偽裝成HTTP/1.1的方法。分享給大家供大家參考。具體如下: 添加下面的代碼到 settings.py 文件 代碼如下:DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactor

本文實例講述了Python使用scrapy采集時偽裝成HTTP/1.1的方法。分享給大家供大家參考。具體如下:
添加下面的代碼到 settings.py 文件
代碼如下:
DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'
保存以下代碼到單獨的.py文件
代碼如下:
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class PageGetter(ScrapyHTTPPageGetter):
def sendCommand(self, command, path):
self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))
class HTTPClientFactory(ScrapyHTTPClientFactory):
protocol = PageGetter
希望本文所述對大家的Python程序設計有所幫助。
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com
Python使用scrapy采集時偽裝成HTTP/1.1的方法
Python使用scrapy采集時偽裝成HTTP/1.1的方法:本文實例講述了Python使用scrapy采集時偽裝成HTTP/1.1的方法。分享給大家供大家參考。具體如下: 添加下面的代碼到 settings.py 文件 代碼如下:DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactor