用python批量替換MD檔案中的圖片地址

wait4friend發表於2018-05-09

原文網址 : https://juejin.im/post/5af2ad0c6fb9a07ac363758b

背景

在用Markdown格式記錄我的技術筆記過程中，我習慣把所有的圖片先儲存在本地，而不是直接上傳到圖床上去。這樣的好處是，一方面我可以有本地備份，不用擔心圖床哪一天掛掉了；另一方面，如果我想把某一篇筆記釋出到部落格，我可以隨時把圖片上傳，然後更新圖片地址。

Mac平臺下的Typora + iPic的組合，雖然很強大，但是不能滿足我奇葩的需求。所以就寫了一個簡單的python指令碼來處理。因為會配合KM一起使用，所以這個指令碼的任務就只需要處理單一檔案即可。

KM指令碼參見 KeyboardMaestro_PathFinder_依次處理多個選中檔案

需求

通過指定入參處理單一檔案，更新圖片URL；
能把MD檔案中的圖片拷貝到本地其他目錄（方便備份）；
能把MD檔案中的圖片從本地上傳到圖床（方便釋出）；
能把部落格上文章內嵌的圖片抓到本地；

原始碼

整體邏輯如下：

判斷入參是一個合法的MD檔案；
正規表示式查詢所有圖片地址的列表；
根據不同的操作模式
1. 本地模式，把圖片拷貝到指定目錄下，生成新url
2. 圖床模式，把本地圖片上傳到阿里雲OSS，生成新url
3. 下拉模式，暫未實現。。。
用新url替換原來的url

replace_md_url.py

#!/usr/bin/env -S -P${HOME}/anaconda/bin python
# -*- coding:utf-8 -*-

import re, os, shutil, time, sys, argparse
from itertools import chain
import oss2

# 需要替換url的MD檔案
md_file = ''

# 操作型別, L2L (預設本地到本地)， L2W（本地到圖床）， W2L（圖床到本地）
action = 'L2L'

# 儲存圖片檔案的根目錄
dir_base = '/*******/_MD_Media'

# Markdown中圖片語法 ![](url) 或者 <img src='' />
img_patten = r'!\[.*?\]\((.*?)\)|<img.*?src=[\'\"](.*?)[\'\"].*?>'


def get_img_local_path(md_file, path):
    """
    獲取MD檔案中嵌入圖片的本地檔案絕對地址
    :param md_file: MD檔案
    :param path: 圖片URL
    :return: 圖片的本地檔案絕對地址
    """

    result = None

    # /a/b/c
    if path.startswith('/'):
        result = path
    # ./a/b/c
    elif path.startswith('.'):
        result = '{0}/{1}'.format(os.path.dirname(md_file), path)
    # file:///a/b/c
    elif path.startswith('file:///'):
        result = path[8:]
        result = result.replace('%20',' ')
    else:
        result = '{0}/{1}'.format(os.path.dirname(md_file), path)

    return result

def local_2_local(md_file, dir_ts, match):
    """
    把MD中的本地圖片移動到指定目錄下，並返回URL。 這裡並沒有進行URL的替換
    :param md_file:
    :param dir_ts:
    :param match:
    :return: new_url，新本地檔案地址。如果不需要替換，就返回空
    """
    dir_tgt = '{0}/{1}'.format(dir_base, dir_ts)
    new_url = None
    # 判斷是不是已經是一個圖片的網址，或者已經在指定目錄下
    if not (re.match('((http(s?))|(ftp))://.*', match) or re.match('{}/.*'.format(dir_base), match)):
        # 如果圖片url是本地檔案，就替換到指定目錄
        img_file = get_img_local_path(md_file, match)
        if os.path.isfile(img_file):
            new_url = '{0}/{1}'.format(dir_tgt, os.path.basename(match))
            os.makedirs(dir_tgt, exist_ok=True)
            # 移動物理檔案
            shutil.move(img_file, dir_tgt)

    return new_url

def local_2_web(md_file, dir_ts, match):
    """
    把MD中的本地圖片上傳到OSS下，並返回URL。 這裡並沒有進行URL的替換
    :param md_file:
    :param dir_ts:
    :param match:
    :return: new_url，新本地檔案地址。如果不需要替換，就返回空
    """

    # 阿里雲OSS資訊
    bucket_name = "b******ce"
    endpoint = "http://oss-cn-beijing.aliyuncs.com"
    access_key_id = "******"
    access_key_secret = "******"
    web_img_prfix = 'https://******.oss-cn-beijing.aliyuncs.com'
    # 建立Bucket物件，所有Object相關的介面都可以通過Bucket物件來進行
    bucket = oss2.Bucket(oss2.Auth(access_key_id, access_key_secret), endpoint, bucket_name)

    new_url = None
    # 判斷是不是已經是一個圖片的網址
    if not (re.match('((http(s?))|(ftp))://.*', match) ):
        # 如果圖片url是本地檔案，就上傳
        img_file = get_img_local_path(md_file, match)
        if os.path.isfile(img_file):
            key_url = '{0}/{1}'.format(dir_ts, os.path.basename(match))
            bucket.put_object_from_file(key_url, img_file)
            new_url = '{}/{}'.format(web_img_prfix, key_url)

    return new_url

def replace_md_url(md_file):
    """
    把指定MD檔案中引用的圖片移動到指定地點（本地或者圖床），並替換URL
    :param md_file: MD檔案
    :return:
    """

    if os.path.splitext(md_file)[1] != '.md':
        print('{}不是Markdown檔案，不做處理。'.format(md_file))
        return

    cnt_replace = 0
    # 本次操作時間戳
    dir_ts = time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime())

    with open(md_file, 'r',encoding='utf-8') as f: #使用utf-8 編碼開啟
        post = f.read()
        matches = re.compile(img_patten).findall(post)
        if matches and len(matches)>0 :
            # 多個group整合成一個列表
            for match in list(chain(*matches)) :
                if match and len(match)>0 :
                    new_url = None

                    # 進行不同型別的URL轉換操作
                    if action == 'L2L':
                        new_url = local_2_local(md_file, dir_ts, match)
                    elif action == 'L2W':
                        new_url = local_2_web(md_file, dir_ts, match)

                    # 更新MD中的URL
                    if new_url :
                        post = post.replace(match, new_url)
                        cnt_replace = cnt_replace + 1

        # 如果有內容的話，就直接覆蓋寫入當前的markdown檔案
        if post and cnt_replace > 0:
            open(md_file, 'w', encoding='utf-8').write(post)
            print('{0}的{1}個URL被替換到<{2}>/{3}'.format(os.path.basename(md_file), cnt_replace, action, dir_ts))
        elif cnt_replace == 0:
            print('{}中沒有需要替換的URL'.format(os.path.basename(md_file)))





if __name__ == '__main__':
    parser = argparse.ArgumentParser()

    parser.add_argument('-f', '--file', help='檔案Full file name ofMarkdown file.')
    parser.add_argument('-a', '--action', help='操作型別： L2L, L2W, W2L .')
    parser.add_argument('-d', '--dir', help='Base directory to store MD images.')

    args = parser.parse_args()

    if args.action:
        action = args.action
    if args.dir:
        dir_base = args.dir
    if args.file:
        replace_md_url(args.file)



複製程式碼

grep、sed批量替換檔案內容shell
2019-01-05
puppet替換檔案中的string
2018-12-04
Java Word中的文字、圖片替換功能
2020-06-02
Java
從CSV檔案中讀取jpg圖片的URL地址並多執行緒批量下載
2019-02-16
執行緒
Python 在Excel中插入、替換、提取、或刪除圖片
2024-10-21
PythonExcel
linux中批量替換文字中字串
2018-08-17
Linux字串
python 檔案操作（二）替換性修改檔案內容
2019-02-10
Python
批量修改檔案中的圖片名稱
2020-10-01
Python 在PDF中新增、替換、或刪除圖片
2024-07-29
Python
光流.flo檔案生成.png圖片(可批量)
2018-04-15
Python批量處理圖片
2019-07-10
Python
圖片上傳顯示替換
2018-04-18
如何將一個PDF檔案裡的圖片批量匯出
2018-11-27
怎麼替換公司網站圖片
2024-10-07
網站
如何替換公司網站的圖片和影片
2024-10-11
網站
.NET 8 使用官方OpenXml SDK，替換Word中的文字和圖片
2024-05-22
XML
使用shell指令碼替換csv檔案中的資料
2024-05-29
指令碼
k8s Java 專案替換 jar 中的 class 檔案
2024-04-24
K8SJavaJAR
python批量ppt轉圖片，pdf轉圖片，word轉圖片指令碼
2021-11-29
Python指令碼
WkWebView攔截替換本地音訊，圖片
2018-08-08
WebView音訊
替換專案中的包名
2019-03-20
vim內替換檔案內容
2018-05-09
sed 原地替換檔案時遇到的趣事
2023-11-04
aspose word轉換pdf檔案後將pdf檔案轉換為圖片png
2024-09-07
手機使用python操作圖片檔案
2019-02-18
Python
RTF 批量轉換為 DOCX 檔案
2018-04-26
用python寫一段指令碼：將舊的影片檔案中的音訊替換成新的，並儲存成新的影片檔案
2024-10-04
Python指令碼音訊
【Python】批量給圖片增加水印工具
2021-12-01
Python
怎麼替換公司網站圖片資訊
2024-10-11
網站
word轉html用到的圖片路徑替換上傳
2021-06-18
HTML
[Python]批量編譯pyc檔案
2018-08-28
Python編譯
linux替換jar裡面的class檔案
2020-11-10
LinuxJAR
oracle sqldeveloper下自定義Snippets檔案的替換
2018-08-08
OracleSQLDeveloper
vue專案，axios請求圖片介面，介面返回的是檔案流的形式，如何轉換成圖片？
2019-02-18
VueiOS
檔案替換後怎麼恢復，恢復被覆蓋的檔案
2021-11-11
pandas列值根據字典批量替換
2020-12-23
同名檔案替換怎麼恢復，恢復同名檔案
2021-11-11
使用 Charles 替換後臺返回給客戶端的圖片
2019-07-31
客戶端

用python批量替換MD檔案中的圖片地址

背景

需求

原始碼

相關文章