使用Python库pypdf切分PDF文件
更新日期:
最近有需要将A3版面的PDF页面从中间切分,一个A3页转换为二个A4页面的PDF, 之后就可以使用A4纸打印了。使用了pypdf
库很容易就实现了,再多的pdf页面也都可以一键搞定。
1. 安装pypdf
pypdf
是一个python语言的PDF处理库,可以实现PDF中提取文字、图片, PDF文件合并、页面缩放变形等操作。 更多参见文档:https://pypdf.readthedocs.io/en/stable/user/installation.html。
要求python3.8以上, 使用pip
直接安装
1 | pip install pypdf |
2. 切分PDF
直接粘代码了,实现逻辑超简单。PdfReader
用于读取PDF文件, PdfWriter
写入PDF文件;打开一个PDF文件后,针对每一个页面clone出2份, 分别使用mediabox截取原来的左半边与右半边, 然后就写出到文件里。
参考Cropping and Transforming PDFs: https://pypdf.readthedocs.io/en/stable/user/cropping-and-transforming.html#transforming-several-copies-of-the-same-page
1 | from pypdf import PdfReader, PdfWriter, PaperSize |