All Projects → MengXiangxi → zhihu_Backup

MengXiangxi / zhihu_Backup

Licence: Unlicense License
知乎个人回答备份,获取html并打印到pdf

Programming Languages

HTML
75241 projects
python
139335 projects - #7 most used programming language

Labels

Projects that are alternatives of or similar to zhihu Backup

Webporter
基于 webmagic 的 Java 爬虫应用
Stars: ✭ 2,598 (+6236.59%)
Mutual labels:  zhihu
ZhihuMagnifier
Chrome扩展:知乎头像放大器
Stars: ✭ 31 (-24.39%)
Mutual labels:  zhihu
KotlinEnjoyLife
😉【乐享】Kotlin 版本 每天一张精选妹纸图、一个精选短视频,知乎美文的精美应用
Stars: ✭ 73 (+78.05%)
Mutual labels:  zhihu
Alfred Web Search Suggest
Alfred search suggest workflow for various popular websites.
Stars: ✭ 249 (+507.32%)
Mutual labels:  zhihu
ncovis-2020
covid-19 舆论和新闻的可视化平台,获得了中国计算机学会、阿里云和机器之心等举办的疫情可视化比赛铜奖。🔥
Stars: ✭ 37 (-9.76%)
Mutual labels:  zhihu
eve
👻 everyday explore, Github / HackNews / V2EX / Medium / Product Hunt.
Stars: ✭ 13 (-68.29%)
Mutual labels:  zhihu
Vue Zhihudaily
🗞 知乎日报 Web 基于 Vue 2.3
Stars: ✭ 213 (+419.51%)
Mutual labels:  zhihu
XiaoxiaZhihuWeex
XiaoxiaZhihu(zhihu daily) client written by Weex.
Stars: ✭ 15 (-63.41%)
Mutual labels:  zhihu
zhihudaily-react
知乎日报react版---react+redux+react-router
Stars: ✭ 27 (-34.15%)
Mutual labels:  zhihu
stats-cards
在 README 中展示你在知乎,GitHub,B 站,LeetCode,掘金,CSDN,牛客等网站的数据,服务部署在 Vercel 上,保证服务稳定。Show your LeetCode & GitHub stats in GitHub Profile.
Stars: ✭ 74 (+80.49%)
Mutual labels:  zhihu
userscripts
My user scripts
Stars: ✭ 17 (-58.54%)
Mutual labels:  zhihu
puppeteer-usage
基于puppeteer的实践和应用
Stars: ✭ 18 (-56.1%)
Mutual labels:  zhihu
zhihu-crawler
徒手实现定时爬取知乎,从中发掘有价值的信息,并可视化爬取的数据作网页展示。
Stars: ✭ 56 (+36.59%)
Mutual labels:  zhihu
Awesome crawl
腾讯新闻、知乎话题、微博粉丝,Tumblr爬虫、斗鱼弹幕、妹子图爬虫、分布式设计等
Stars: ✭ 246 (+500%)
Mutual labels:  zhihu
zhihu
搜索你的知乎收藏:可以直观地浏览你的所有收藏夹的内容,并进行全文搜索
Stars: ✭ 39 (-4.88%)
Mutual labels:  zhihu
Zhihu Analysis Python
Social Network Analysis of Zhihu with Python
Stars: ✭ 215 (+424.39%)
Mutual labels:  zhihu
zhihu
我的知乎内容
Stars: ✭ 42 (+2.44%)
Mutual labels:  zhihu
zhihu-recover
对知乎已经删除/可能删除的问题备份
Stars: ✭ 15 (-63.41%)
Mutual labels:  zhihu
XiaoxiaZhihu AAC
使用Android Architecture Components实现的一个简单知乎日报程序
Stars: ✭ 63 (+53.66%)
Mutual labels:  zhihu
zh-downloader
一个可以直接下载知乎视频的浏览器插件
Stars: ✭ 54 (+31.71%)
Mutual labels:  zhihu

zhihu_Backup

知乎个人回答备份,获取html并打印到pdf

缘起和功能

知乎是中文互联网中流量很高的社会化问答网站。我自2011年起一直是知乎的用户,见证了该平台的兴衰。然而近来,知乎管理人员出于不明原因,粗暴侵犯部分用户的基本权利,侵害了我使用其服务的基础,使我无法在该平台上发表内容。有鉴于此,我决定备份本用户既往在知乎上发表的全部回答,并随后删除之。

知乎没有提供官方的接口,但程序员七秒不觉梦提供了他尝试解析出的OAuth2接口。这一项目具有非常高的质量,也是本工作的最重要的基础。在此对开发者表示敬意。由于html外链一些图片文件仍可能依赖知乎的服务器数据,故在下载后将其打印到pdf文件,保持独立性。

本工作包括三个简单的脚本。它们的功能是在根目录下备份当前用户全部回答。在这一框架基础上稍加改写,也可以用于和知乎相关的其它数据获取任务。

依赖关系和运行环境

本脚本在Windows 10下测试通过,但理论上在Linux和macOS上也是可用的。

脚本执行顺序和功能

顺序 文件名 功能
1 zhihu_login.py 登录知乎并保存token
2 zhihu_backup.py 获取个人动态中全部回答的信息,并创建html文件
3 zhihu_html2pdf.py 将获取的html文件保存成PDF
各html和pdf文件 输出样例

测试数据来自本知乎账户,测试完成后已经手动删除全部历史回答,但可见仍有大量信息保存在知乎服务器上或无法删除。

已知问题

  • PDF不支持部分多媒体文件的备份,如动图等。
  • 我觉得评论内容不重要,就没有予以备份。如有需求可自行修改。
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].