Skip to content

haoaa/node_crawler

Repository files navigation

node爬虫下载头像

  • crawler.js node-crawler demo
  • crawler.download.js node-crawler 下载头像
  • demo.js express服务显示读取的头像图片地址
  • download.js 下载头像
  • puppeteer yarn add puppeteer
参考:

node-crawler

  1. 异常处理: 超时和重试的实现比较好
  2. 有些操作自由度没有自己写的代码高, 如基于当前页面结果来判断下一步操作

puppeteer

node version >6.4, await >7.6

安装

    1. set PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=1
    1. npm i --save puppeteer --ignore-scripts
    1. 翻出去下载chrome https://download-chromium.appspot.com, 解压后在启动时指定路径
      await puppeteer.launch({
        executablePath: '../chrome-win/chrome.exe', // 指定路径
        headless: false // 打开浏览器
      });
    1. 版本1.7后yarn add puppeteer-core不直接下载chromium
参考:

About

node爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published