之前发了【Python】Word表格汇总Excel ,没想到挺受欢迎,由此看来需求还是有的。实则我自己工作倒是没有这个需求,都是帮朋友写的。
前两天看到了 请给位大神推荐个好用excel提取汇总工具,然后我试了下几个Excel插件,汇总的基本都是全部数据(可能是我潦草试了没有用对),对于只需要部分数据的人来说还是不够方便的。
之前也有人写过了 Excel提取汇总 ,不过楼主表明软件兼容性不太好,我就趁闲写了个python版的,使用了xlwings,功能比较简单,也没有费劲整图形界面,增加了进度条。用法也和我之前那个类似。
【功能】
1. 将多个Excel表格数据汇总到Excel表格;
【使用】【更新】
1. 数据备份;
2. [模板]: 在相应单元格填Excel列数并删除其他所有内容;
3. [数字前加单引号]: 可避免手机号等科学记数法;
4. [对日期格式化]: 将各种格式的日期统一格式;
5. [来源工作簿及工作表名称]:在模板文件随意单元格填写b-m-n,其中m为工作簿名称要填入的列数,n为工作表名称要填入的列数,一样时以-连接;
6. 增加工作簿多工作表情况:
①所有工作表格式一样,全部汇总到同一目标表格,此时目标表格和模板文件都只有一个工作表;
②工作表格式不同(或一样),需要分别汇总到目标表格对应的目标工作表,此时目标表格和模板文件有和原表格一样数量的工作表。
7.
空表不汇总;
8. 处理xls格式;
【示例】
1. 目前需要汇总形如以下格式的Excel表格:

2. 需要汇总的Excel格式如下:

3. 根据需要提取的数据所处的Excel列数制作模板如下(单工作表或多工作表):

4. 然后运行选择目录和模板文件即可。
【源码】【更新】
# -*- coding: UTF-8 -*-
import os, re, sys
import xlwings as xw
import tkinter as tk
from tkinter import filedialog
class Xlsx2Xlsx(object):
def __init__(self):
super(Xlsx2Xlsx, self).__init__()
self.pattern = re.compile(r"(d{2,4})D*(d{0,2})D*(d{0,2})")
# files path
def filePath(self):
root = tk.Tk()
root.withdraw()
path = filedialog.askdirectory(title = "选择Excel文件目录")
model = filedialog.askopenfilename(title="选择Excel模板",filetypes=(('File', '*.*'),('XLSX', '*.xlsx'),('XLS','*.xls')))
xls = [i for i in os.listdir(path) if (i.endswith(".xlsx") or i.endswith(".xls")) and not i.startswith("~$")]
return path, xls, model
# xlsx 2 xlsx
def xlsx2xlsx(self, path, xls, model):
app = xw.App(visible=False, add_book=False)
#获取模板数据
wb_model = app.books.open(model)
data = []
for i in range(len(wb_model.sheets)):
ws_model = wb_model.sheets[i]
info = ws_model.used_range
nrows = info.last_cell.row
ncols = info.last_cell.column
data.append(ws_model.range((1, 1), (nrows, ncols)).value) #所有行数据
wb_model.close()
wb_result=app.books.add() #新建表格
row = 1
nums = len(xls)
size = 40 #符号数量即进度条长度
for r, x in enumerate(xls):
wb_xl = app.books.open(path + r"/" + x)
for s in range(len(wb_xl.sheets)):
#判断是否为空表
ws_xl = wb_xl.sheets[s]
ws_range = ws_xl.used_range
ws_info = ws_xl.range((1, 1), (ws_range.last_cell.row, ws_range.last_cell.column)).value
if ws_info is None or all(i is None for j in ws_info for i in j): #空表
continue
flag = 0 if len(data) == 1 else s #模板是否只有一个工作表
line = row if len(data) == 1 else r + 1
d = data[flag]
wsnames = [i.name for i in wb_result.sheets]
shtname = "Sheet%d" %(flag + 1)
ws_result = wb_result.sheets[shtname] if shtname in wsnames else wb_result.sheets.add(shtname, after = wsnames[-1])
for i, m in enumerate(d):
if any(m):
for j, n in enumerate(m):
if n: #需要提取该单元格
val = ws_xl.range((i + 1, j + 1)).value
if isinstance(n, float): #我这里如果模板为纯数字,读取后为1.0这样的浮点数,若报错回复我修改
ws_result.range((line, int(n))).value = val
elif "'" in n or "‘" in n or "’" in n or n.isdigit(): #存在单引号(这里半角单引号实则并无法读取,只显示为字符串的数字),防止错输入为全角
ser = int(n) if n.isdigit() else int(n[1:])
ws_result.range((line, ser)).value = r"'" + str(int(val)) if val else ''
elif "d" in n or "D" in n: #日期
sym = n[-1] if n[-1] != "d" and n[-1] != "D" else ""
ser = int(n.split("d")[0]) if "d" in n else int(n.split("D")[0])
if val:
date = self.pattern.findall(str(val))[0]
if date[2]:
date = "{}{}{:0>2s}{}{:0>2s}".format(date[0], sym, date[1], sym, date[2])
elif date[1]:
date = "{}{}{:0>2s}".format(date[0], sym, date[1])
else:
date = date[0]
ws_result.range((line, ser)).value = date
else:
ws_result.range((line, ser)).value = ''
elif "b" in n or "B" in n:
ser1 = int(n.split("-")[1])
ser2 = int(n.split("-")[2])
if ser1 != ser2:
ws_result.range((line, ser1)).value = x
ws_result.range((line, ser2)).value = ws_xl.name
else:
ws_result.range((line, ser1)).value = x + "-" + str(ws_xl.name)
row += 1
wb_xl.close()
bar = "
{:>3.0f}%| ".format((r+1)/nums*100) + "{{:u0020<{}s}}".format(size).format("u2588"*int((r+1)/nums*size)) + " {{:0>{}d}}|{}".format(len(str(nums)), nums).format(r+1)
# sys.stdout.write(bar) #不换行打印,需环境支持
# sys.stdout.flush()
print(bar)
wb_result.save(os.path.dirname(model) + "/" + "result.xlsx") #保存到与模板文件一样位置
wb_result.close()
app.quit()
if __name__ == '__main__':
x2x = Xlsx2Xlsx()
path, xls, model = x2x.filePath() x2x.xlsx2xlsx(path, xls, model)[s]
【链接】【更新】
https://lykisun.lanzoui.com/b00ubl0ib
密码:52pj
【链接已更新,打不开的搜索一下蓝奏链接打不开的问题】
【问题】
1、出错注意仔细查看有没有按照说明制作模板,或者翻一下评论看看有没有自己的问题;
2、来源表有隐藏工作表;
3、Excel为精简版等非正式版或未装Excel;


















- 最新
- 最热
只看作者