All Projects → gumblex → wqxt_pdf

gumblex / wqxt_pdf

Licence: LGPL-3.0 license
WQXT PDF Downloader

Programming Languages

python
139335 projects - #7 most used programming language

“文泉学堂”PDF下载

文泉学堂

  1. 安装 requirements.txt 里的依赖
  2. 找到你要的书,看地址栏的数字为 id
  3. 运行 python3 crawl_wqxt.py <id>

服务器生成图片需要时间,可能出现 not loaded,会稍候重试。若一直出现 not loaded(第二遍还是),请尝试重新运行,已下载的图片不会重新下载。

若需要清理缓存,请删除 wqxt.db 或自行更改其内容(SQLite 数据库)。

若需要登录,请自行在 crawl_wqxt.py 的 HEADERS(36行)里加 Cookie 等内容。

请合理使用服务器资源。版权问题概不负责。

imgautocompress.py 会对下载的图片判断是否为灰度、是否为黑白,并转成相应格式,减少图片大小。

要类似地减少其他扫描版 PDF 文件大小,可以使用 pdfreduce。要添加 OCR 层,可使用 ocrmypdf

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].