Python 自用程式碼（拆分txt檔案）

右介發表於2017-06-08

原文網址 : https://www.cnblogs.com/zhangtianyuan/p/6963243.html

現有一個28G的txt檔案，裡面每一行是一個分詞過的專利全文文件，一共370多萬行。我需要把它按每五萬行為單位做成一個json檔案，格式大致如下：

[{"id":"100000001","quanwen":"你好張夢"}，...] 其中每個quanwen中內容是每一行的文字。

# -*- coding: utf-8 -*-
import json

def func(num):
    f1 = open("result.txt", "r")
    ls = []  
    m = 100000001+(num-1)*50000 #m變數為id
    n = 1
    for eachline in f1:
        if n<((num-1)*50000+1):
            n+=1
            continue
        data = {}
        data["id"] = str(m)
        data["quanwen"] = eachline.replace('\n', ' ')
        ls.append(data)
        m += 1
        if m==(100000001+num*50000):
            break
    f2 = open('%s.json'%str(num), 'w')    
    f2.write(json.dumps(ls))
    f2.close()
    f1.close()

i = 1
while i < 76:
    func(i)
    i+=1

.txt檔案透過Excel拆分行/列
2024-04-03
Excel
python處理txt檔案
2020-10-10
Python
前端程式碼拆分
2018-10-12
前端
python怎麼寫txt檔案路徑
2021-09-11
Python
wireshark使用-----拆分抓包檔案
2020-12-22
webpack之程式碼拆分
2019-03-04
Web
[20200225]alert檔案亂碼問題.txt
2020-02-25
Python提取文字檔案（.txt）資料的方法
2024-05-24
Python
shell指令碼命令執行python檔案&python命令列執行python程式碼
2018-04-26
指令碼Python命令列
檔案拆分命令 split 使用簡介
2019-01-25
linux檔案合併、去重、拆分
2019-02-27
Linux
資料檔案合併與拆分
2020-11-19
python基礎1 - 多檔案專案和程式碼規範
2020-04-05
Python
php如何上傳txt檔案，並且讀取txt檔案
2020-12-12
PHP
python程式碼讀取遠端檔案的方法--paramiko
2019-04-15
Python
Python中檔案讀取與儲存程式碼示例
2024-04-15
Python
[20191011]拆分rowid 2.txt
2019-10-11
Aspose.Words使用教程之如何寫入純文字(TXT)檔案,表的合併與拆分
2018-08-16
[work] python讀取txt檔案最後一行
2019-01-11
Python
python如何將資料寫入本地txt文字檔案
2021-09-11
Python
Python程式碼打包成可執行檔案的常用方法！
2023-02-02
Python
SQLSERVER匯出TXT文字檔案，ORACLE SQL LOADER匯入TXT文字檔案
2018-05-15
SQLServerOracle
Python中列已安裝包和requirements.txt檔案
2024-05-10
PythonUIREM
MATLAB生成.coe檔案和.mif檔案程式碼示例
2018-08-14
Matlab
PDF轉換器可以做到PDF轉Office，TXT，HTM，PDF檔案；PDF合併拆分，壓縮，加密解密！
2020-10-22
加密解密
Python 大資料量文字檔案高效解析方案程式碼實現
2022-12-18
Python大資料
python實現圖書管理系統——通過excel檔案或者TXT檔案存放資料
2020-10-28
PythonExcel
程式碼安全之上傳檔案
2018-05-31
程式碼安全之檔案包含
2018-05-31
python讀取資料集檔案下所有檔案並打亂劃分生成訓練測試txt檔案（生成train.txt、test.txt，順序隨機，預設比例8:2）
2020-11-26
PythonAI隨機
[20190329]grep與管道檔案.txt
2019-03-29
[20191009]檔案頭fuzzy.txt
2019-10-09
[20201112]tmpwatch 刪除檔案.txt
2020-11-13
[20190530]oracle Audit檔案管理.txt
2019-05-30
Oracle
[20220427]ls 忽略特定檔案.txt
2022-04-29
python——幾行程式碼，偷偷複製U盤檔案到電腦
2018-08-14
Python行程
幾行Python程式碼快速解析、整理上萬份資料檔案
2019-08-23
Python
將自己的python程式碼打包成exe的可執行檔案
2020-12-14
Python
react程式碼拆分之react loadable原始碼淺析
2019-03-01
React原始碼

Python 自用程式碼（拆分txt檔案）

相關文章