近日有个excel处理的工作,研发同事整理了产品所支持的EN-DC和CA组合列表,但因其他原因,并不是常规的格式,共上千行,需要将其整理为内部常规格式。
一种方式是最笨最直接的,在最全的模板上一行行标注,然后过滤整理,估计没有2~3天是搞不完的。
另外一种方式是使用excel内置的函数或VBA,对这块真有点不熟悉。
再一种是Python来处理。
因为很早之前有简单用过Python,所以利用空闲时间去查了下Python处理EXCEL的资料,边学边用,简单记录之过程。
1、Python操作excel的库
Python的强大之处在于有各式各样功能库,可以直接安装,简单调用。
搜索了下Python操作Excel的库,有如下几个列表。
过滤条件是可操作.xlsx的,同时支持读/写/改的,也就xlwings/openpyxl/win32com/pandas 这几个了。
参考资料:
https://blog.csdn.net/qq_34617032/article/details/80433939
2、openpyxl库
因为喜欢open的,所以第一个选定的是openpyxl,简单写了下sample,感觉还比较好用,比较简单些。后面会进一步研究
参考资料:
https://openpyxl.readthedocs.io/en/stable/
https://geek-docs.com/python/python-tutorial/python-openpyxl.html
3、pandas 库
因为涉及两个excel的读取和合并处理,所以感觉这个库更加适合
https://www.dataquest.io/blog/pandas-cheat-sheet/
https://github.com/pandas-dev/pandas
其他几个库暂时未有时间去看,后面有空再去看下,目前这两个库已经可以满足当前需求。