- crawler.js node-crawler demo
- crawler.download.js node-crawler 下载头像
- demo.js express服务显示读取的头像图片地址
- download.js 下载头像
- puppeteer yarn add puppeteer
- 异常处理: 超时和重试的实现比较好
- 有些操作自由度没有自己写的代码高, 如基于当前页面结果来判断下一步操作
-
set PUPPETEER_SKIP_CHROMIUM_DOWNLOAD=1
-
npm i --save puppeteer --ignore-scripts
-
- 翻出去下载chrome https://download-chromium.appspot.com, 解压后在启动时指定路径
await puppeteer.launch({ executablePath: '../chrome-win/chrome.exe', // 指定路径 headless: false // 打开浏览器 });
- 翻出去下载chrome https://download-chromium.appspot.com, 解压后在启动时指定路径
-
- 版本1.7后
yarn add puppeteer-core不直接下载chromium
- 版本1.7后