控制异步回调利器 - async 串行series,并行parallel,智能控制auto简介
async 作为大名鼎鼎的异步控制流程包,在npmjs.org 排名稳居前五,目前已经逐渐形成node.js下控制异步流程的一个规范.async成为异步编码流程控制的老大哥绝非偶然,它不仅使用方便,文档完善,把你杂乱无章的代码结构化,生辰嵌套的回掉清晰化.
async 提供的api包括三个部分:
(1)流程控制 常见的几种流程控制.
(2)集合处理 异步操作处理集合中的数据.
(3)工具类 .
github 开源地址: https://github.com/caolan/async
安装方法: npm install async
使用方法: var async=require('async');
串行且无关联
场景:提取某学校大三学生的学生信息(假设每个班级存储在一个独立的数据表里)
分析:每个班级的学生之间是无关联的,假设共有3个班级,我们需要遍历3个表,把提取出的学生信息返回客户端一个json,如下
{ "1班":[{name:"张三",age:"21",class:"1班"},......(省略N个学生)] "2班":[{name:"李四",age:"22",class:"2班"},......(省略N个学生)] "3班":[{name:"王五",age:"22",class:"3班"},......(省略N个学生)] }
如果不使用 async
var class=require('./module/class'); export.pageStudent=function(req,res){ var rtnJson={}; class.getStudent('1班',function(error,oneResult){ if(!error&&oneResult){ rtnJson['1班']=oneResult; class.getStudent('2班',function(error,twoResult){ if(!error&&twoResult){ rtnJson['2班']=twoResult; class.getStudent('3班',function(error,threeResult){ if(!error&&threeResult){ rtnJson['3班']=threeResult; //3个班级全部获取完成 res.render('./veiw/pageStudent',{students:rtnJson}); }else{ res.render('./veiw/pageStudent',{students:rtnJson}); } }); }else{ res.render('./veiw/pageStudent',{students:rtnJson}); } }); }else{ res.render('./veiw/pageStudent',{students:rtnJson}); } }); }
如果某个年级有8个班级,那这样嵌套下去会是什么样的结果.....如果有一天修改逻辑,自己回头查看自己的代码也是一头雾水,不知该从哪下手.
利用 async series 控制串行无关联流程,用法如下:
async.series({ flag1:function(done){ //flag1 是一个流程标识,用户自定义 //逻辑处理 done(null,返回结果)// 第一个参数是异常错误,第二个参数的返回结果 }, flag2:function(done){ //逻辑处理 done('error info',null) //如果返回错误信息, //下面的流程控制将会被中断,直接跳到最后结果函数 }, },function(error,result){ //最后结果 //result是返回结果总集,包含了所有的流程控制 , //result.flag1 可以获取标识1中处理的结果 });
所以我们用 series 来串行控制一下这个流程:
async.series({ oneClass:function(done){ class.getStudent('1班',function(error,oneResult){ if(!error) done(null,oneResult); else done(error,null); }); }, twoClass:function(done){ class.getStudent('2班',function(error,twoResult){ if(!error) done(null,twoResult); else done(error,null); } }, threeClass:function(done){ class.getStudent('3班',function(error,threeResult){ if(!error) done(null,threeResult); else done(error,null); } } },function(error,result){ if(!error) callback(null,result); else callback(error,null); });
上面是一个标准的串行流程,代码可读性很强, 容易维护,但是这种流程只适合按顺序执行且每一步没有关联
如果你的业务逻辑是根本不需要按顺序执行的,比如获取不同班级的信息,其实先获取1班和先获取3班是一样的,只要最后结果保证3个班的人员信息都获取成功即可.所以这里用series 是一种错误,反而和 node.js 的异步IO相互矛盾.应该用 并行且无关联的控制流程.
串行无关联模式要求每一步执行成功后才能执行下一步流程.所以是一个同步编程思想.看我写的一个demo 的执行时间
//测试代码,没有任何逻辑处理,按4步执行,最后看执行时间. console.time('series'); var async = require('async'); async.series({ one: function (done) { //处理逻辑 done(null, 'one'); }, two: function (done) { //处理逻辑 done(null, 'tow'); }, three: function (done) { //处理逻辑 done(null, 'three'); }, four: function (done) { //处理逻辑 done(null, 'four'); } }, function (error, result) { console.log('one:', result.one); console.log('two:', result.two); console.log('three:', result.three); console.log('four:', result.four); console.timeEnd('series'); })
分4步串行控制,最后耗时 14毫秒
并行且无关联
场景如上,获取4个班级学生信息.
async 里的提供的并行无关联 api 是 parallel
parallel 的原理是同时并行处理每一个流程,最后汇总结果,如果某一个流程出错就退出.把获取班级成员信息的代码用 parallel 来实现如下
async.parallel({ oneClass:function(done){ class.getStudent('1班',function(error,oneResult){ if(!error) done(null,oneResult); else done(error,null); }); }, twoClass:function(done){ class.getStudent('2班',function(error,twoResult){ if(!error) done(null,twoResult); else done(error,null); } }, threeClass:function(done){ class.getStudent('3班',function(error,threeResult){ if(!error) done(null,threeResult); else done(error,null); } } },function(error,result){ if(!error) callback(null,result); else callback(error,null); });
看上去和串行无关联的代码只是换了一个关键词而已,确实是这样,他们接收的参数形式完全一致.但是实现方法却完全不同,还是用demo数据来测试
var async = require('async'); console.time('parallel'); async.parallel({ one: function (done) { //处理逻辑 done(null, 'one'); }, two: function (done) { //处理逻辑 done(null, 'tow'); }, three: function (done) { //处理逻辑 done(null, 'three'); }, four: function (done) { //处理逻辑 done(null, 'four'); } }, function (error, result) { console.log('one:', result.one); console.log('two:', result.two); console.log('three:', result.three); console.log('four:', result.four); console.timeEnd('parallel'); })
一样是4个控制流程,并行模式下耗时 3毫秒,大约接近串行模式耗时1/5 (此比例是单样本统计,只供参考)
串行且有关联
场景:打开微博首页需要加载 微博个人信息,微博分组信息,微博分组粉丝信息 这里不考虑ajax 异步拉取每个模块.如果我们用ejs来渲染,需要发送给前端页面一个这样的数据结构(简单的模拟数据)
{ userInfo:{userID:10001,totalNum:368,fans:562,follow:369} group:[{groupID:100,groupName:"粉丝"},{groupID:200,groupName:"同事"}...], fansGroup:{"粉丝":[{nickName:'aa',age:20},{nickName:'bb',age:22}....]} }
上面的信息取自3个不同的表,但是每一个流程都和上一个流程有关系,也就是说,如果拿到用户信息后,根据用户ID 获取此微博用户的分组,根据分组ID获取每个组里面的粉丝.一环扣一环,希望流程按顺序执行,且每一步逻辑控制都能由上一步得到的结果来做条件.
var userInfo=require('./lib/module/userInfo'); var group=require('./lib/module/group'); var groupFans=require('./lib/module/groupFans'); //传统嵌套代码如下 export.pageIndex=function(req,res){ userInfo.get(userEmail,passWord,function(error,userInfo){ group.get(userInfo.userID,function(error,groupList){ var idx=0,fansList=[]; for(var i=0;i<groupList.length;i++){ groupFans.get(groupList[idx++],function(error,fansInfo){ fansList.push(fansInfo); if(idx==groupList.length){ callback(null,{userInfo:userInfo,group:groupList,fansGroup:fansList}); } }) } }); }); }
上面的代码互相牵扯关系,每一步的逻辑运算都需要上一步的结果来支持,我们假设每一步都运行正确,没有对error 进行判断.
最后因为要遍历数组中元素,然后把每个元素对应的分组成员都组合起来,我们用到了数据索引计数器 idx,上面的代码看似没有问题,但是索引计数器非常不好控制,稍有差错可能会不运行.
anync 的waterfall 适合上面的场景.
waterfall 每一步执行时需要由上一步执行的结果当做参数.所以每一步必须串行等待.事例代码如下:
console.time('waterfall'); async.waterfall([ function (done) { done(null, 'one'); }, function (onearg, done) { done(null, onearg + '| two'); }, function (twoarg, done) { done(null, twoarg + '| three'); }, function (threearg, done) { done(null, threearg + '| four'); } ], function (error, result) { console.log(result); console.timeEnd('waterfall'); })
上面调用 waterfall 函数时传入一个数组,数组总的每一个元素就是一个串行控制节点,每一个节点执行必须保证上一节点已经执行完成且拿到结果.这样将结果传入下一个控制节点作为参数来运行.
参数数组第一个元素回调函数 done(null,'one') -->null 说明执行没有错误, 'one' 是第一个节点运行返回的结果(这个结果将会传入第二个控制流程来作为参数).....这样以此类推,最后一个元素(第四个)返回的结果应该是 'one|tow|three|four ' 这个字符串,也就是 result 打印出的内容.
注意:
async 提供的api默认支持多种传递参数的写法,我个人比较喜欢用对象表示法来传递( json格式) 但是waterfall 这个api很特殊,不支持对象参数,如果你用下面的错误代码来调用 waterfall 的话,你不会拿到运行结果.
//此调用方法是错误的!!! console.time('waterfall'); async.waterfall({ one: function (done) { //处理逻辑 done(null, 'one'); }, two: function (onearg, done) { //处理逻辑 console.log('-----', onearg); done(null, onearg + 'two'); }, three: function (twoarg, done) { //处理逻辑 done(null, twoarg + 'three'); }, four: function (threearg, done) { //处理逻辑 done(null, threearg + 'four'); } }, function (error, result) { console.log(result); console.timeEnd('waterfall'); })
最后由于拿不到返回结果,调用结果为 undefined
智能控制 auto
如果你的逻辑代码很繁琐,涉及到很多的流程控制,但是部分流程是相互依赖的,部分又是无依赖关系而并行独立的.这时 auto 这个智能控制流程 api 再适合你不过了. 后续补充....