python效能調優的一次記錄

發表於2016-02-01

最近在grahite上看到響應時間變得很長，雖說之前沒有特意去優化效能，但是感覺也不應該這麼差才對。

QQ20150406 1

我們的伺服器框架用的就是我之前開源的 maple，每個命令字都對應一個入口函式，如下：

@app.route(2)
def login(request):
    logger.error("login: %s", request.gw_box)
    uid = request.box.get_json()["uid"]
    request.login_client(uid)
    time.sleep(1)
    request.write_to_client(dict(
        ret=0,
        body="login %s" % uid
    ))

@app.route(2)

def login(request):

logger.error("login: %s", request.gw_box)

uid = request.box.get_json()["uid"]

request.login_client(uid)

time.sleep(1)

request.write_to_client(dict(

ret=0,

body="login %s" % uid

))

所以只要找到一種方法分析這個函式對應的內部呼叫情況就可以了。

很方便的，python內建了cProfile類來完成我們想要的功能，我給封裝成為一個裝飾器，用起來更方便一些，當然在django和flask中也可以直接用。

def monitor_profile(func):
    import cProfile
    import functools
    @functools.wraps(func)
    def func_wrapper(*args, **kwargs):
        def tmpfunc():
            return func(*args, **kwargs)
        # 直接用run是不行的
        cProfile.runctx("tmpfunc()", globals(), locals(), "%s.stat" % func.__name__)
    return func_wrapper

def monitor_profile(func):

import cProfile

import functools

@functools.wraps(func)

def func_wrapper(*args, **kwargs):

def tmpfunc():

return func(*args, **kwargs)

# 直接用run是不行的

cProfile.runctx("tmpfunc()", globals(), locals(), "%s.stat" % func.__name__)

return func_wrapper

執行到對應的函式後，就會將統計寫到函式名對應的stat檔案中，比如 login.stat。

相應的，我也封裝了一個分析工具：

import sys
import argparse
import pstats

def build_parser():
    parser = argparse.ArgumentParser()
    parser.add_argument('-f', '--file', help='stat filename', action='store', required=True)
    parser.add_argument('-s', '--sort', help='sort type: cumulative, time', action='append')
    parser.add_argument('-p', '--percent', help='sort type', action='store', default=0.5, type=float)
    parser.add_argument('-d', '--dir', help='show directory', action='store_true')
    return parser

def main():
    args = build_parser().parse_args()
    p = pstats.Stats(args.file)

    sort_keys = args.sort or ('cumulative', 'time')

    if not args.dir:
        p = p.strip_dirs()

    p.sort_stats(*sort_keys).print_stats(args.percent)

if __name__ == '__main__':
    main()

import sys

import argparse

import pstats

def build_parser():

parser = argparse.ArgumentParser()

parser.add_argument('-f', '--file', help='stat filename', action='store', required=True)

parser.add_argument('-s', '--sort', help='sort type: cumulative, time', action='append')

parser.add_argument('-p', '--percent', help='sort type', action='store', default=0.5, type=float)

parser.add_argument('-d', '--dir', help='show directory', action='store_true')

return parser

def main():

args = build_parser().parse_args()

p = pstats.Stats(args.file)

sort_keys = args.sort or ('cumulative', 'time')

if not args.dir:

p = p.strip_dirs()

p.sort_stats(*sort_keys).print_stats(args.percent)

if __name__ == '__main__':

main()

用起來非常簡單，執行一下:

python stat.py -f login.stat -p0.1

1	python stat.py -f login.stat -p0.1

輸出結果如下:

Mon Apr  6 11:16:02 2015    login.stat

         442 function calls (439 primitive calls) in 1.002 seconds

   Ordered by: cumulative time, internal time
   List reduced from 107 to 11 due to restriction

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    1.002    1.002 :1()
        1    0.000    0.000    1.002    1.002 worker.py:40(tmpfunc)
        1    0.000    0.000    1.002    1.002 worker.py:46(login)
        1    1.000    1.000    1.000    1.000 {time.sleep}
        1    0.000    0.000    0.001    0.001 request.py:73(write_to_client)
        1    0.000    0.000    0.001    0.001 __init__.py:1176(error)
        1    0.000    0.000    0.001    0.001 __init__.py:1260(_log)
        3    0.000    0.000    0.000    0.000 box.py:41(__init__)
        1    0.000    0.000    0.000    0.000 request.py:146(login_client)
        1    0.000    0.000    0.000    0.000 __init__.py:1281(handle)
        1    0.000    0.000    0.000    0.000 __init__.py:1313(callHandlers)

Mon Apr 6 11:16:02 2015 login.stat

442 function calls (439 primitive calls) in 1.002 seconds

Ordered by: cumulative time, internal time

List reduced from 107 to 11 due to restriction

ncalls tottime percall cumtime percall filename:lineno(function)

1 0.000 0.000 1.002 1.002 :1()

1 0.000 0.000 1.002 1.002 worker.py:40(tmpfunc)

1 0.000 0.000 1.002 1.002 worker.py:46(login)

1 1.000 1.000 1.000 1.000 {time.sleep}

1 0.000 0.000 0.001 0.001 request.py:73(write_to_client)

1 0.000 0.000 0.001 0.001 __init__.py:1176(error)

1 0.000 0.000 0.001 0.001 __init__.py:1260(_log)

3 0.000 0.000 0.000 0.000 box.py:41(__init__)

1 0.000 0.000 0.000 0.000 request.py:146(login_client)

1 0.000 0.000 0.000 0.000 __init__.py:1281(handle)

1 0.000 0.000 0.000 0.000 __init__.py:1313(callHandlers)

可以明顯看到時間消耗在 time.sleep 上。

好了，上面只是一個簡單的示例，接下來看今天解決的問題的真實情況。

下面兩張圖分別是牌桌內有2人和7人的情況下的呼叫圖。

2人：

QQ20150406 3

7人：

QQ20150406 2

異常的部分均使用顏色加亮了，可以看出幾個端倪：

隨著人數變多，有些部分的請求翻了幾倍
讀取資料庫和redis的呼叫量太大

既然知道了是與儲存通訊的問題，那麼接下來就來看看是哪些地方呼叫了 get_db_user，get_user_from_db。

cProfile 提供了一個方法:

#如果想知道有哪些函式呼叫了bar,可使用
p.print_callers(0.5, "bar")

1 2	#如果想知道有哪些函式呼叫了bar,可使用 p.print_callers(0.5, "bar")

所以通過這種方法拿到:

4EF1E801 22DE 45B1 BC10 9CF9154FB56B

CBF7C01C C2D2 4164 A5C7 673B38B11EB4

所以接下來就去看下上面的程式碼中這些資料庫呼叫是否是必要就可以了。

基本就是這樣了。

另外之前也出現過python記憶體洩漏的定位，可惜沒有寫下來文件，只記得是用 objgraph，不過用起來也比較簡單，等下次遇到再說吧。

java效能調優記錄
2024-10-06
Java
java效能調優記錄（限流）
2019-01-19
Java
java效能調優記錄（執行緒阻塞）
2019-01-17
Java執行緒
記一次 Laravel 應用效能調優經歷
2017-08-30
Laravel
一次 JVM 調優的筆記
2015-10-12
JVM筆記
RabbitMq 最全的效能調優筆記
2019-01-19
MQ筆記
GC調優記錄（一）
2020-11-03
GC
一次效能測試調優總結
2019-08-17
一次openrestyhttp.lua效能調優之旅
2017-06-05
RESTHTTP
一次效能優化調整過程.
2004-09-19
優化
? 記一次前端效能優化
2019-05-10
前端優化
記一次前端效能優化的案例
2017-11-02
前端優化
記錄一次打包優化
2018-09-21
優化
Mysql查詢調優記錄
2017-05-04
MySql
記一次SQL調優過程
2019-10-10
SQL
一次 kafka 消費者的效能調優過程
2024-04-19
Kafka
記一次我的 MySQL 調優經歷
2019-05-27
MySql
記一次效能優化經歷
2015-09-15
優化
記一次提升18倍的效能優化
2022-03-02
優化
SQL Server效能調優札記 [zt]
2009-02-20
SQLServer
QT專案效能調優小記
2016-05-30
QT
一次效能壓測及分析調優實踐
2020-08-05
Spark的效能調優
2016-03-10
Spark
JVM效能調優，記憶體分析工具
2023-02-11
JVM記憶體
Spark 效能調優--資源調優
2021-09-09
Spark
Spark 效能調優--Shuffle調優 SortShuffleManager
2018-01-05
Spark
記一次SQL Server刪除SQL調優
2019-10-15
SQLServer
【效能調優】效能測試、分析與調優基礎
2020-12-24
oracle筆記整理13——效能調優之SQL優化
2016-01-16
Oracle筆記SQL優化
ElasticSearch效能調優
2019-01-15
Elasticsearch
Nginx 效能調優
2017-01-05
Nginx
iOS效能調優
2017-01-09
iOS
php效能調優
2014-06-09
PHP
Java效能調優
2012-10-26
Java
Spark效能調優
2016-03-10
Spark
oracle效能調優
2008-03-04
Oracle
記一次Prometheus代理效能優化問題
2022-03-25
Prometheus優化
第一次指令微調大模型記錄
2024-11-20
大模型

python效能調優的一次記錄

相關文章