async是node的一个强大的异步第三方库,它包含许多功能方法,今天主要用其中的mapLimit
方法来实现并行执行爬虫.mapLimit(coll,limit, iteratee, callbackopt)
接收四个参数:
coll:是一个迭代器,代表要迭代的集合
limit:数字代表同时执行并行的限制
iteratee:迭代器方法,对于coll中的每一个item,迭代执行该异步函数。用(item, callback)调用,callback可选
callbackopt:所有iteratee 函数完成后或发生错误时触发的回调函数。用(err, results)调用。
1 | const puppeteer = require('puppeteer') |
result: