Python獲取jsonp資料

＇Radio＇發表於2023-05-09

原文網址 : https://www.cnblogs.com/primice/p/17386065.html

使用python爬取資料時，有時候會遇到jsonp的資料格式，由於不是json的，所以不能直接使用json.loads()方法來解析，需要先將其轉換為json格式，再進行解析。在前面講了jsonp的原理，這裡就略過一部分。

jsonp的格式

jsonp的內容一般是這樣的:

callback({
    "name":"zhangsan",
    "age":18
})

也有有可能是這樣的:

callback(
    'name',
    (function(a,b,c){
        return {
            name:a,
            age:b,
            gender:c
        }
    })('孫悟空',18,'男')
)

這裡的callback就是一個函式名，這個函式名是由後端返回的，我們需要將這個函式名提取出來，然後將其替換為一個我們自己定義的函式名，然後再將其轉換為json格式，再進行解析。

這個函式名一般會包含在get請求的引數中，例如:

<script src="xxx.xxx?callback=cb"></script>

在這個url中，callback=cb是我們傳給伺服器的引數，我們可以理解為告訴伺服器我們需要將資料傳入cb這個函式中，然後伺服器返回的資料就會以cb(data)的形式返回，例如:

cb({
    "name":"zhangsan",
    "age":18
})

獲取資料

方法一

通常情況下伺服器返回的資料呼叫哪個函式由傳遞的callback引數決定，如果我們將callback的引數改為我們自己定義的函式名，那麼伺服器就會返回這個函式名。
因此，我們也可以嘗試將callback引數填寫為空，例如:

import requests
requests.get('xxx.xxx?callback=')

這樣伺服器就會直接返回資料而不是用函式包裹

方法二

透過字串切片或者正規表示式來提取資料，例如:


import requests
import re
res = requests.get('xxx.xxx?callback=cb')
# 正規表示式提取
data = re.search('cb\((.*?)\)',res).group(1)
# 字串切片提取
data = res[3:-1]

方法三

使用subprocess庫執行js程式碼，但是jsonp返回的資料中只有一個呼叫函式的程式碼，因此我們需要提前定義一個函式，並將內容寫入js檔案後執行，例如:

import requests
import subprocess

cb_data = requests.get('xxx.xxx?callback=cb').text
# 定義一個函式
js = '''   
function cb(data) {
    console.log(data);
}
'''
# 將函式寫入js檔案
with open('jsonp.js','w',encoding='utf-8') as f:
    f.write(js+cb_data)

# 執行js檔案的同時捕獲列印資訊
result = subprocess.run('node jsonp.js',shell=True,stout=subprocess.PIPE)
# 將結果轉換為json
json = json.loads(res.stdout.decode())
""" json轉換時可能會出錯,因此可以在定義的函式中將console.log(data) 修改為 console.log( JSON.stringify(data)) """
# 列印轉換後的內容
print(json)

以上，簡單的介紹了三種獲取jsonp資料的方式，如果有錯誤或不足之處歡迎指正

jsonp跨域獲取資料實現百度搜尋
2018-06-24
JSON跨域
python的queue佇列獲取資料
2024-06-20
Python佇列
如何用python分析xml獲取資料？
2021-09-11
PythonXML
python獲取全國地鐵資料
2021-11-11
Python
透過Python SDK 獲取tushare資料
2021-09-09
Python
Python教程之獲取網路資料！
2021-05-24
Python
微信小程式呼叫騰訊地圖獲取jsonp資料解析詳細地址資訊
2018-08-03
微信小程式地圖JSON
python 獲取excel資料自動登陸
2019-02-21
PythonExcel
使用Python獲取HTTP請求頭資料
2024-06-17
PythonHTTP
python獲取歷屆金雞獎資料
2021-11-29
Python
原生JS和jQuery分別使用jsonp來獲取“當前天氣資訊”
2018-06-24
jQueryJSON
Python量化交易系統實戰--獲取股票資料
2024-04-12
Python
python獲取、修改mysql資料庫欄位屬性
2024-04-08
PythonMySql資料庫
使用Python呼叫API介面獲取淘寶商品資料
2023-11-13
PythonAPI
Python爬蟲精簡步驟1 獲取資料
2020-02-17
Python爬蟲
python獲取愛彼迎民宿評價資料
2022-02-11
Python
python爬蟲獲取天氣網實時資料
2022-11-29
Python爬蟲
1.獲取資料
2024-04-01
獲取Wireshark資料流
2024-03-20
Modbus ASCII 獲取資料
2024-08-27
ASCII
datatables 獲取 pageLength 和 pageStart，重新獲取table資料
2018-08-02
【Python】獲取機器使用資訊
2018-12-13
Python
python 從mongodb中獲取資料載入到pandas中
2019-03-16
PythonMongoDB
Python3 - 獲取資料夾中的檔案列表
2018-12-22
Python
python 獲取全國最新省市區資料，並存入表
2021-08-11
Python
MySQL 資料庫表格建立、資料插入及獲取插入的 ID：Python 教程
2023-11-09
MySql資料庫Python
獲取天氣介面資料
2018-11-05
Mysql批量大資料獲取
2019-03-07
MySql大資料
【譯】React如何獲取資料
2019-03-04
React
datatables使用ajax獲取資料
2024-10-11
如何獲取想要的資料？
2024-06-21
jqGrid獲取json資料方法
2021-09-09
JSON
從session中獲取資料
2020-12-12
Session
使用Python獲取ECS相關資訊
2018-12-09
Python
【Python小隨筆】 SSH 獲取資訊
2024-03-23
Python
python使用cx_Oracle連線oracle資料庫獲取常用資訊
2018-04-22
PythonOracle資料庫
如獲取獲取關聯資料的文件跟模型的關聯資料集呢
2020-04-04
模型
Python 利用pandas和mysql-connector獲取Excel資料寫入到MySQL資料庫
2023-10-27
PythonMySqlExcel資料庫

Python獲取jsonp資料

jsonp的格式

獲取資料

方法一

方法二

方法三

相關文章