async/await 非同步應用的常用場景

changli2018發表於2019-05-12

前言

async/await 語法用看起來像寫同步程式碼的方式來優雅地處理非同步操作,但是我們也要明白一點,非同步操作本來帶有複雜性,像寫同步程式碼的方式並不能降低本質上的複雜性,所以在處理上我們要更加謹慎, 稍有不慎就可能寫出不是預期執行的程式碼,從而影響執行效率。下面將簡單地描述一下一些日常常用場景,加深對 async/await 認識

最普遍的非同步操作就是請求,我們也可以用 setTimeOut 來簡單模擬非同步請求。

場景1. 一個請求接著一個請求

相信這個場景是最常遇到,後一個請求依賴前一個請求,下面以爬取一個網頁內的圖片為例子進行描述,使用了 superagent 請求模組, cheerio 頁面分析模組,圖片的地址需要分析網頁內容得出,所以必須按順序進行請求。


const request = require('superagent')
const cheerio = require('cheerio')
// 簡單封裝下請求,其他的類似

function getHTML(url) {
// 一些操作,比如設定一下請求頭資訊
return superagent.get(url).set('referer', referer).set('user-agent', userAgent)
}
// 下面就請求一張圖片
async function imageCrawler(url) {
    let res = await getHTML(url)
    let html = res.text
    let $ = cheerio.load(html)
    let $img = $(selector)[0]
    let href = $img.attribs.src
    res = await getImage(href)
    retrun res.body
}
async function handler(url) {
    let img = await imageCrawler(url)
    console.log(img) // buffer 格式的資料
    // 處理圖片
}
handler(url)
複製程式碼

上面就是一個簡單的獲取圖片資料的場景,圖片資料是載入進記憶體中,如果只是簡單的儲存資料,可以用流的形式進行儲存,以防止消耗太多記憶體。

其中 await getHTML 是必須的,如果省略了 await 程式就不能按預期得到結果。執行流程會先執行 await 後面的表示式,其實際返回的是一個處於 pending 狀態的 promise,等到這個 promise 處於已決議狀態後才會執行 await 後面的操作,其中的程式碼執行會跳出 async 函式,繼續執行函式外面的其他程式碼,所以並不會阻塞後續程式碼的執行。

場景2.併發請求

有的時候我們並不需要等待一個請求回來才發出另一個請求,這樣效率是很低的,所以這個時候就需要併發執行請求任務。下面以一個查詢為例,先獲取一個人的學校地址和家庭住址,再由這些資訊獲取詳細的個人資訊,學校地址和家庭住址是沒有依賴關係的,後面的獲取個人資訊依賴於兩者


async function infoCrawler(url, name) {
    let [schoolAdr, homeAdr] = await Promise.all([getSchoolAdr(name), getHomeAdr(name)])
    let info = await getInfo(url + `?schoolAdr=${schoolAdr}&homeAdr=${homeAdr}`)
    return info
}
複製程式碼

上面使用的 Promise.all 裡面的非同步請求都會併發執行,並等到資料都準備後返回相應的按資料順序返回的陣列,這裡最後處理獲取資訊的時間,由併發請求中最慢的請求決定,例如 getSchoolAdr 遲遲不返回資料,那麼後續操作只能等待,就算 getHomeAdr 已經提前返回了,當然以上場景必須是這麼做,但是有的時候我們並不需要這麼做。

上面第一個場景中,我們只獲取到一張圖片,但是可能一個網頁中不止一張圖片,如果我們要把這些圖片儲存起來,其實是沒有必要等待圖片都併發請求回來後再處理,哪張圖片早回來就儲存哪張就行了


let imageUrls = ['href1', 'href2', 'href3']
async function saveImages(imageUrls) {
    await Promise.all(imageUrls.map(async imageUrl => {
    let img = await getImage(imageUrl)
    return await saveImage(img)
}))
    console.log('done')
}
// 如果我們連儲存是否全部完成也不關心,也可以這麼寫
let imageUrls = ['href1', 'href2', 'href3']
// saveImages() 連 async 都省了
function saveImages(imageUrls) {
    imageUrls.forEach(async imageUrl => {
    let img = await getImage(imageUrl)
    saveImage(img)
    })
}
複製程式碼

可能有人會疑問 forEach 不是不能用於非同步嗎,這個說法我也在剛接觸這個語法的時候就聽說過,很明顯 forEach 是可以處理非同步的,只是是併發處理,map 也是併發處理,這個怎麼用主要看你的實際場景,還要看你是否對結果感興趣

場景3.錯誤處理

一個請求發出,可以會遇到各種問題,我們是無法保證一定成功的,報錯是常有的事,所以處理錯誤有時很有必要, async/await 處理錯誤也非常直觀, 使用 try/catch 直接捕獲就可以了


async function imageCrawler(url) {
    try {
        let img = await getImage(url)
        return img
    } catch (error) {
        console.log(error)
    }
}
// imageCrawler 返回的是一個 promise 可以這樣處理
async function imageCrawler(url) {
    let img = await getImage(url)
    return img
}
imageCrawler(url).catch(err => {
    console.log(err)
})
複製程式碼

可能有人會有疑問,是不是要在每個請求中都 try/catch 一下,這個其實你在最外層 catch 一下就可以了,一些基於中介軟體的設計就喜歡在最外層捕獲錯誤


async function ctx(next) {
    try {
        await next()
    } catch (error) {
        console.log(error)
    }
}
複製程式碼

場景4. 超時處理

一個請求發出,我們是無法確定什麼時候返回的,也總不能一直傻傻的等,設定超時處理有時是很有必要的


function timeOut(delay) {
    return new Promise((resolve, reject) => {
        setTimeout(() => {
        reject(new Error('不用等了,別傻了'))
        }, delay)
    })
}

async function imageCrawler(url,delay) {
    try {
        let img = await Promise.race([getImage(url), timeOut(delay)])
        return img
    } catch (error) {
        console.log(error)
    }
}
複製程式碼

這裡使用 Promise.race 處理超時,要注意的是,如果超時了,請求還是沒有終止的,只是不再進行後續處理。當然也不用擔心,後續處理會報錯而導致重新處理出錯資訊, 因為 promise 的狀態一經改變是不會再改變的

場景5. 併發限制

在併發請求的場景中,如果需要大量併發,必須要進行併發限制,不然會被網站遮蔽或者造成程式崩潰


async function getImages(urls, limit) {
    let running = 0
    let r
    let p = new Promise((resolve, reject) => {
    r = resolve
    })
    function run() {
        if (running < limit && urls.length > 0) {
            running++
            let url = urls.shift();
            (async () => {
                let img = await getImage(url)
                running--
                console.log(img)
                if (urls.length === 0 && running === 0) {
                    console.log('done')
                    return r('done')
                } else {
                    run()
                }
            })()
            run()  // 立即到併發上限
        }
    }
    run()
    return await p
}
複製程式碼

總結

以上列舉了一些日常場景處理的程式碼片段,在遇到比較複雜場景時,可以結合以上的場景進行組合使用,如果場景過於複雜,最好的辦法是使用相關的非同步程式碼控制庫。如果想更好地瞭解 async/await 可以先去了解 promise 和 generator, async/await 基本上是 generator 函式的語法糖,下面簡單的描述了一下內部的原理。


function delay(time) {
    return new Promise((resolve, reject) => {
        setTimeout(() => {
            resolve(time)
        }, time)
    })
}
function *createTime() {
    let time1 = yield delay(1000)
    let time2 = yield delay(2000)
    let time3 = yield delay(3000)
    console.log(time1, time2, time3)
}
let iterator = createTime()
console.log(iterator.next())
console.log(iterator.next(1000))
console.log(iterator.next(2000))
console.log(iterator.next(3000))
// 輸出

{ value: Promise { <pending> }, done: false } 

{ value: Promise { <pending> }, done: false }

 { value: Promise { <pending> }, done: false } 

1000 2000 3000 

{ value: undefined, done: true }

複製程式碼

可以看出每個 value 都是 Promise,並且通過手動傳入引數到 next 就可以設定生成器內部的值,這裡是手動傳入,我只要寫一個遞迴函式讓其自動添進去就可以了


function run(createTime) {
    let iterator = createTime()
    let result = iterator.next()
    function autoRun() {
        if (!result.done) {
            Promise.resolve(result.value).then(time => {
            result = iterator.next(time)
            autoRun()
        }).catch(err => {
            result = iterator.throw(err)
            autoRun()
            })
        }
    }
    autoRun()
}
run(createTime)
複製程式碼

promise.resove 保證返回的是一個 promise 物件 可迭代物件除了有 next 方法還有 throw 方法用於往生成器內部傳入錯誤,只要生成內部能捕獲該物件,生成器就可以繼承執行,類似下面的程式碼


function delay(time) {
    return new Promise((resolve, reject) => {
        setTimeout(() => {
            if (time == 2000) {
            reject('2000錯誤')
        }
            resolve(time)
        }, time)
    })
}
function *createTime() {
    let time1 = yield delay(1000)
    let time2
    try {
        time2 = yield delay(2000)
    } catch (error) {
        time2 = error
    }
    let time3 = yield delay(3000)
    console.log(time1, time2, time3)
}
複製程式碼

可以看出生成器函式其實和 async/await 語法長得很像,只要改一下 async/await 程式碼片段就是生成器函式了


async function createTime() {
    let time1 = await delay(1000)
    let time2
    try {
        time2 = await delay(2000)
    } catch (error) {
        time2 = error
    }
    let time3 = await delay(3000)
    console.log(time1, time2, time3)
}

function transform(async) {
  let str = async.toString()
  str = str.replace(/async\s+(function)\s+/, '$1 *').replace(/await/g, 'yield')
  return str
}
複製程式碼

相關文章