Python快取技術

公號_python學習開發發表於2018-10-16

原文網址 : https://juejin.im/post/5bc5a255e51d450e64765065

一段非常簡單程式碼

普通呼叫方式

def console1(a, b):
    print("進入函式")
    return (a, b)

print(console1(3, 'a'))
print(console1(2, 'b'))
print(console1(3.0, 'a'))
複製程式碼

很簡單的一段程式碼，傳入兩個引數。然後列印輸出。
輸出結果

進入函式
(3, 'a')
進入函式
(2, 'b')
進入函式
(3.0, 'a')
複製程式碼

使用某個裝飾器後

接下來我們引入functools模組的lru_cache，python3自帶模組。

from functools import lru_cache
@lru_cache()
def console2(a, b):
    print("進入函式")
    return (a, b)
print(console2(3, 'a'))
print(console2(2, 'b'))
print(console2(3.0, 'a'))
複製程式碼

ほら、驚喜來了。

進入函式
(3, 'a')
進入函式
(2, 'b')
(3, 'a')
複製程式碼

我們發現，少了一次進入函式的列印，這是怎麼回事呢？
這就是接下來要說的LRU快取技術了。

我們理解下什麼是LRU

LRU (Least Recently Used) 是快取置換策略中的一種常用的演算法。當快取佇列已滿時，新的元素加入佇列時，需要從現有佇列中移除一個元素，LRU 策略就是將最近最少被訪問的元素移除，從而騰出空間給新的元素。

python中的實現

python3中的functools模組的lru_cache實現了這個功能，
lru_cache裝飾器會記錄以往函式執行的結果，實現了備忘
（memoization）功能，避免引數重複時反覆呼叫，達到提高效能的作用，在遞迴函式中作用特別明顯。這是一項優化技術，它把耗時的函式的結果儲存起來，避免傳入相同的引數時重複計算。

帶引數的lru_cache

使用方法lru_cache(maxsize=128, typed=False)
maxsize可以快取最多個此函式的呼叫結果，從而提高程式執行的效率，特別適合於耗時的函式。
引數maxsize為最多快取的次數，如果為None，則無限制，設定為2的n次冪時，效能最佳；
如果 typed=True，則不同引數型別的呼叫將分別快取，例如 f(3) 和 f(3.0)，預設False
來一段綜合程式碼：

from functools import lru_cache

def console1(a, b):
    print("進入函式")
    return (a, b)


@lru_cache()
def console2(a, b):
    print("進入函式")
    return (a, b)


@lru_cache(maxsize=256, typed=True)
def console3(a, b):
    '''

    :param a:
    :param b:
    :return:
    '''
    print("進入函式")
    return (a, b)


print(console1(3, 'a'))
print(console1(2, 'b'))
print(console1(3.0, 'a'))
print("*" * 40)
print(console2(3, 'a'))
print(console2(2, 'b'))
print(console2(3.0, 'a'))
print("*" * 40)
print(console3(3, 'a'))
print(console3(2, 'b'))
print(console3(3.0, 'a'))
複製程式碼

同樣的可以用到爬蟲的去重操作上，避免網頁的重複請求。
在後期儲存的時候做判斷即可。

from functools import lru_cache
from  requests_html import HTMLSession
session=HTMLSession()
@lru_cache()
def get_html(url):
    req=session.get(url)
    print(url)
    return req

urllist=["https://www.baidu.com","https://pypi.org/project/pylru/1.0.9/","https://www.baidu.com"]

if __name__ == '__main__':
    for i in urllist:
        print(get_html(i))
複製程式碼

輸出

https://www.baidu.com
<Response [200]>
https://pypi.org/project/pylru/1.0.9/
<Response [200]>
<Response [200]>
複製程式碼

ok，今天的內容就到這裡，趕緊去試一試吧

快取技術
2019-02-16
快取
前端常用的快取技術
2019-04-19
前端快取
Redis 快取雪崩，快取擊穿和快取穿透技術方案總結
2021-02-04
Redis快取穿透
從WebView快取聊到Http 的快取機制 | 掘金技術徵文
2019-03-03
WebView快取HTTP
小工匠聊架構 - 分散式快取技術_快取設計
2020-12-17
架構分散式快取
前端效能優化之快取技術
2019-03-03
前端優化快取
系統效能提升利刃 | 快取技術使用
2020-10-12
快取
高手如何處理快取：SpringBoot整合Redis實現快取處理(AOP技術）！
2020-04-04
快取Spring BootRedis
搞懂分散式技術15：快取更新的套路
2019-11-20
分散式快取
搞懂分散式技術13：快取的那些事
2019-11-20
分散式快取
前端優化：瀏覽器快取技術介紹
2018-09-08
前端優化瀏覽器快取
Java技術分享：如何設計一個本地快取？
2021-04-21
Java快取
Redis快取技術的應用？-北京銳智互動
2019-11-12
Redis快取
帶你走進memcache，老牌記憶體快取技術
2021-01-24
記憶體快取
使用傳統前端技術增強客戶端快取能力
2019-03-01
前端客戶端快取
SpringBoot系列（十五）整合快取，專案會用得到的技術
2021-07-06
Spring Boot快取
每天5分鐘複習OpenStack（十三）儲存快取技術Bcache
2024-04-24
快取
技術派中的快取一致性解決方案
2023-05-09
快取
系統效能提升利刃 | 快取技術使用的實踐與思考
2019-08-15
快取
搞懂分散式技術14：Spring Boot使用註解整合Redis快取
2019-11-20
分散式Spring BootRedis快取
Python中pycharm如何清理快取?
2023-12-18
PythonPyCharm快取
10分鐘掌握Python快取
2024-06-26
Python快取
Python培訓技術分享：Python Cookie HTTP獲取cookie並處理
2021-09-15
PythonCookieHTTP
快取穿透、快取擊穿、快取雪崩、快取預熱
2024-06-07
快取穿透
Azure技術系列之Redis篇---第一章資料快取
2020-09-13
Redis快取
快取穿透、快取擊穿、快取雪崩
2019-04-06
快取穿透
快取穿透、快取雪崩、快取擊穿
2020-10-28
快取穿透
【技術快報】5.30-6.5
2022-09-30
【技術快報】7.4-7.10
2022-11-05
【技術快報】10.3-10.9
2023-03-31
【技術快報】5.23-5.29
2022-10-27
Python操作Redis快取資料庫
2019-05-13
PythonRedis快取資料庫
Redis快取擊穿、快取穿透、快取雪崩
2019-10-11
Redis快取穿透
[Redis]快取穿透/快取擊穿/快取雪崩
2024-08-17
Redis快取穿透
HTTP快取——協商快取（快取驗證）
2021-08-21
HTTP快取
當裝飾者模式遇上Read Through快取，一場技術的浪漫邂逅
2024-05-20
模式快取
快取穿透快取雪崩
2019-01-13
快取穿透
快取問題(一) 快取穿透、快取雪崩、快取併發核心概念
2020-11-10
快取穿透