国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術(shù)文章
文章詳情頁

Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫入excel文檔的操作

瀏覽:20日期:2022-07-05 18:38:14

我就廢話不多說了,大家還是直接看代碼吧~

#!/usr/bin/python# -*- coding: utf-8 -*-import xlwtimport redef host_regex(dataline): host_regex = r'<host>(.*?)</host>' host = re.findall(host_regex, dataline) if host: return host[0]def ip_regex(dataline): ip_regex = r'<ip>(.*?)</ip>' ip = re.findall(ip_regex, dataline) if ip: return ip[0]with open('zbx_export_hosts.xml', 'r', encoding='utf8') as f: lines = f.readlines() alldatas = [] hostlist = [] iplist = [] for line in lines: host = host_regex(line) ip = ip_regex(line) if host is not None: hostlist.append(host) if ip is not None: iplist.append(ip) hosts_ip = [] # 構(gòu)造數(shù)據(jù)結(jié)構(gòu),形如:[[a,b],[c,d],...] multi_list = map(list, zip(hostlist, iplist)) for multi in multi_list: hosts_ip.append(multi) workbook = xlwt.Workbook() worksheet = workbook.add_sheet(’test’) # 關(guān)鍵代碼 for hi in enumerate(hosts_ip): for num in range(len(hi[1])): # 行、列、值 worksheet.write(hi[0], num, hi[1][num]) workbook.save(’excelwrite.xls’)

PS:其實(shí)有兩行代碼冗余,就不刪了!

補(bǔ)充知識:通過python寫入xlsx大量數(shù)據(jù)問題簡述

以前批處理生成數(shù)據(jù)文件都是通過c程序直接按照逗號分隔方式寫文本文件以csv保存的。但是由于有些處理的數(shù)據(jù)表直接給業(yè)務(wù)人員看,業(yè)務(wù)人員習(xí)慣使用xls,因此提了些需求改造,對于一些小于100w的數(shù)據(jù)均要求改為xlsx文件格式的報表。

考慮報表文件數(shù)據(jù)處理便捷,因此決定用python實(shí)現(xiàn),最初使用了openpyxl庫,這個python庫擁有非常強(qiáng)大的xlsx的讀寫api,能夠很方便的實(shí)現(xiàn)讀寫。但是在實(shí)際使用中發(fā)現(xiàn)在處理較大行數(shù)的xlsx時,占用內(nèi)存非常嚴(yán)重,8個字段50w行數(shù)據(jù)在運(yùn)行中內(nèi)存高達(dá)10G,這不是我們應(yīng)用服務(wù)器能夠接受的范圍。

因此尋求改善,在網(wǎng)上了解后,發(fā)現(xiàn)創(chuàng)建xlsx表時,指定write_only參數(shù)是openpyxl提供的大數(shù)據(jù)寫入解決方案,以下摘自官網(wǎng)范例,在選擇了此參數(shù)后,無法通過ws.cell(row=i, column=j).value = ? 的方式復(fù)制,只能通過append的方式追加行。關(guān)于設(shè)置只寫cell設(shè)置樣式,可以直接查看官網(wǎng)

>>> from openpyxl import Workbook>>> wb = Workbook(write_only=True)>>> ws = wb.create_sheet()>>>>>> # now we’ll fill it with 100 rows x 200 columns>>>>>> for irow in range(100):... ws.append([’%d’ % i for i in range(200)]) #可以先將一行的數(shù)據(jù)寫在一個list中,直接ws.append(list)>>> # save the file>>> wb.save(’new_big_file.xlsx’) # doctest: +SKIP

不過僅僅按上述范例修改write_only跑數(shù)時發(fā)現(xiàn)內(nèi)存占用并沒有緩解,再仔細(xì)閱讀官網(wǎng)說明時才發(fā)現(xiàn)這么一句話“When you want to dump large amounts of data make sure you have lxml installed.”原來在openpyxl安裝時,并沒有把lxml作為強(qiáng)依賴,只是一個可選包,然后查實(shí)發(fā)現(xiàn)確實(shí)服務(wù)器上并沒有安裝lxml包。

于是與為了解決這個問題先在測試環(huán)境上安裝lxml,安裝過程也不是很順利。

首先先要裝libxml2以及l(fā)ibxslt,因為沒有root權(quán)限,均為源碼安裝,且只能安裝在用戶目錄。需要注意的是libxml2在安裝時需要--with-python=’python安裝目錄’,libxslt安裝的時候需要指定libxml2安裝目錄。

尤其最后的lxml安裝也是坑挺多的,主要是指定libxml2和libxslt,安裝lxml時先python3 setup.py build_ext -i -I${libxml2includepath} -L${libxml2libpath} -I${libxsltincludepath} -L${libxsltlibpath} ,再python3 setup.py install。

全部安裝完之后,確實(shí)openpyxl寫xlsx不再增加內(nèi)存,先在tmp目錄一個臨時文件中寫,待調(diào)用save方法時,保存到正式文件。

此外在這個問題解決中,還了解到writexlsx庫也可以處理大文件xlsx的寫入,并且安裝沒有這么多的依賴,其實(shí)還是非常推薦,也很簡介,官網(wǎng)有介紹。

操作大文件時指定{’constant_memory’: True}即可。

filename = ’test.xlsx’wb = xlsxwriter.Workbook(filename, {’constant_memory’: True})ws = wb.add_worksheet(’大文件’)i = 0data= []data.append(’中文’)data.append(1323)data.append(’abc’)ws.write_row(i, 0, data)i = i + 1wb.close() #直接關(guān)閉即可,不需要額外save

以上這篇Python 使用xlwt模塊將多行多列數(shù)據(jù)循環(huán)寫入excel文檔的操作就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: python
相關(guān)文章:
主站蜘蛛池模板: 精品一区二区视频 | 高跟丝袜美女一级毛片 | 成人欧美午夜视频毛片 | 亚州人成网在线播放 | 日韩精品视频一区二区三区 | 中文国产成人精品久久96 | 91网站在线免费观看 | 日本免费观看的视频在线 | 宅男噜噜噜一区二区三区 | 欧美日韩亚洲在线观看 | 久久久久久全国免费观看 | 新久草视频 | 色播亚洲视频在线观看 | 久久国产一级毛片一区二区 | 欧美激情视频一级视频一级毛片 | 99久久精品久久久久久婷婷 | 69凹凸国产成人精品视频 | 国产黄色三级网站 | 精品国产v无码大片在线观看 | 亚洲悠悠色综合中文字幕 | 岛国在线免费观看 | 日本特级淫片免费看 | 一区二区三区四区在线播放 | 久久观看视频 | 国产一区二区三区四区五区 | 国产日韩一区二区三区在线观看 | 久久欧美 | xp123欧美亚洲国产日韩 | 国产成人一区二区三区高清 | 亚洲国产日韩欧美在线 | 中文字幕 亚洲精品 第1页 | 亚洲 欧美 日韩在线 | 久久高清免费视频 | 澳门毛片在线播放 | 日本女人在线观看 | 国产特黄1级毛片 | 毛片视频网站在线观看 | 俺来也俺来也天天夜夜视频 | 正在播放亚洲一区 | 精品久久久久久影院免费 | 免费观看欧美精品成人毛片能看的 |