国产99久久精品_欧美日本韩国一区二区_激情小说综合网_欧美一级二级视频_午夜av电影_日本久久精品视频

最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當前位置: 首頁 - 科技 - 知識百科 - 正文

node如何爬取網頁中的圖片(附代碼)

來源:懂視網 責編:小采 時間:2020-11-27 19:32:11
文檔

node如何爬取網頁中的圖片(附代碼)

node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
推薦度:
導讀node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。

目錄

  • 安裝node,并下載依賴

  • 搭建服務

  • 請求我們要爬取的頁面,返回json

  • 安裝node

    我們開始安裝node,可以去node官網下載https://nodejs.org/zh-cn/,下載完成后運行node使用,

    node -v

    安裝成功后會出現你所安裝的版本號。

    接下來我們使用node, 打印出hello world,新建一個名為index.js文件輸入

    console.log('hello world')

    運行這個文件

    node index.js

    就會在控制面板上輸出hello world

    搭建服務器

    新建一個·名為node的文件夾。

    首先你需要下載express依賴

    npm install express

    再新建一個名為demo.js的文件 目錄結構如圖:

    在demo.js引入下載的express

    const express = require('express');
    const app = express();
    app.get('/index', function(req, res) {
    res.end('111')
    })
    var server = app.listen(8081, function() {
     var host = server.address().address
     var port = server.address().port
     console.log("應用實例,訪問地址為 http://%s:%s", host, port)
    
    })

    運行node demo.js簡單的服務就搭起來了,如圖:

    請求我們要爬取的頁面

    請求我們要爬取的頁面

    npm install superagent
    npm install superagent-charset
    npm install cheerio

    superagent 是用來發起請求的,是一個輕量的,漸進式的ajax api,可讀性好,學習曲線低,內部依賴nodejs原生的請求api,適用于nodejs環境下.,也可以使用http發起請求

    superagent-charset防止爬取下來的數據亂碼,更改字符格式

    cheerio為服務器特別定制的,快速、靈活、實施的jQuery核心實現.。 安裝完依賴就可以引入了

    var superagent = require('superagent');
    var charset = require('superagent-charset');
    charset(superagent);
    const cheerio = require('cheerio');

    引入之后就請求我們的地址,https://www.qqtn.com/tx/weixintx_1.html,如圖:

    聲明地址變量:

    const baseUrl = 'https://www.qqtn.com/'

    這些設置完之后就是發請求了,接下來請看完整代碼demo.js

    var superagent = require('superagent');
    var charset = require('superagent-charset');
    charset(superagent);
    var express = require('express');
    var baseUrl = 'https://www.qqtn.com/'; //輸入任何網址都可以
    const cheerio = require('cheerio');
    var app = express();
    app.get('/index', function(req, res) {
     //設置請求頭
     res.header("Access-Control-Allow-Origin", "*");
     res.header('Access-Control-Allow-Methods', 'PUT, GET, POST, DELETE, OPTIONS');
     res.header("Access-Control-Allow-Headers", "X-Requested-With");
     res.header('Access-Control-Allow-Headers', 'Content-Type');
     //類型
     var type = req.query.type;
     //頁碼
     var page = req.query.page;
     type = type || 'weixin';
     page = page || '1';
     var route = `tx/${type}tx_${page}.html`
     //網頁頁面信息是gb2312,所以chaeset應該為.charset('gb2312'),一般網頁則為utf-8,可以直接使用.charset('utf-8')
     superagent.get(baseUrl + route)
     .charset('gb2312')
     .end(function(err, sres) {
     var items = [];
     if (err) {
     console.log('ERR: ' + err);
     res.json({ code: 400, msg: err, sets: items });
     return;
     }
     var $ = cheerio.load(sres.text);
     $('div.g-main-bg ul.g-gxlist-imgbox li a').each(function(idx, element) {
     var $element = $(element);
     var $subElement = $element.find('img');
     var thumbImgSrc = $subElement.attr('src');
     items.push({
     title: $(element).attr('title'),
     href: $element.attr('href'),
     thumbSrc: thumbImgSrc
     });
     });
     res.json({ code: 200, msg: "", data: items });
     });
    });
    var server = app.listen(8081, function() {
    
     var host = server.address().address
     var port = server.address().port
    
     console.log("應用實例,訪問地址為 http://%s:%s", host, port)
    
    })

    運行demo.js就會返回我們拿到的數據,如圖:

    一個簡單的node爬蟲就完成了。

    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

    文檔

    node如何爬取網頁中的圖片(附代碼)

    node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
    推薦度:
    標簽: 的圖片 網站 網頁
    • 熱門焦點

    最新推薦

    猜你喜歡

    熱門推薦

    專題
    Top
    主站蜘蛛池模板: 欧美色老头 | 四虎福利视频 | 日本三级成人中文字幕乱码 | 精品国产日韩亚洲一区二区 | 国产高清美女一级毛片久久 | 国产欧美在线观看视频 | 国产一区二区三区在线视频 | 国产视频不卡 | 美女视频黄a视频全免费网站下载 | 欧美国产精品va在线观看 | 久久久国产麻豆 | 欧美三级一区二区 | 综合伊人久久在一二三区 | 国产h视频在线观看 | 亚洲一区中文字幕在线 | 欧美区一区二区三 | 国产成人+综合亚洲+天堂 | 国产精品久久久久久久y | 久久精品免费观看 | 久久福利一区二区 | 成人一级毛片 | 国产高清在线看 | 日韩 国产 欧美 精品 在线 | 日韩综合区 | 免费一级特黄a | 精品一区二区三区18 | 亚洲国产精品二区久久 | 国产成人一区 | 欧美性受一区二区三区 | 国内精品久久久久久中文字幕 | 最新国产精品亚洲二区 | 麻豆系列| 欧美日韩亚洲高清不卡一区二区三区 | 亚洲 欧美 91 | 97一级毛片全部免费播放 | 欧美一区二区三区四区视频 | 欧美极品欧美日韩 | 国产在线每日更新 | 国产在线观看精品 | 欧美日韩国产va另类 | 成人午夜精品 |