All Projects → zjuchenyuan → zhihu-recover

zjuchenyuan / zhihu-recover

Licence: other
对知乎已经删除/可能删除的问题备份

Programming Languages

HTML
75241 projects
CSS
56736 projects

Labels

Projects that are alternatives of or similar to zhihu-recover

Zhihu Analysis Python
Social Network Analysis of Zhihu with Python
Stars: ✭ 215 (+1333.33%)
Mutual labels:  zhihu
zhihudaily-react
知乎日报react版---react+redux+react-router
Stars: ✭ 27 (+80%)
Mutual labels:  zhihu
stats-cards
在 README 中展示你在知乎,GitHub,B 站,LeetCode,掘金,CSDN,牛客等网站的数据,服务部署在 Vercel 上,保证服务稳定。Show your LeetCode & GitHub stats in GitHub Profile.
Stars: ✭ 74 (+393.33%)
Mutual labels:  zhihu
Awesome crawl
腾讯新闻、知乎话题、微博粉丝,Tumblr爬虫、斗鱼弹幕、妹子图爬虫、分布式设计等
Stars: ✭ 246 (+1540%)
Mutual labels:  zhihu
puppeteer-usage
基于puppeteer的实践和应用
Stars: ✭ 18 (+20%)
Mutual labels:  zhihu
zhihu
我的知乎内容
Stars: ✭ 42 (+180%)
Mutual labels:  zhihu
Swiftdailyapi
A Swift API framework for ZhiHu's Daily News.
Stars: ✭ 204 (+1260%)
Mutual labels:  zhihu
XiaoxiaZhihu AAC
使用Android Architecture Components实现的一个简单知乎日报程序
Stars: ✭ 63 (+320%)
Mutual labels:  zhihu
ncovis-2020
covid-19 舆论和新闻的可视化平台,获得了中国计算机学会、阿里云和机器之心等举办的疫情可视化比赛铜奖。🔥
Stars: ✭ 37 (+146.67%)
Mutual labels:  zhihu
zh-downloader
一个可以直接下载知乎视频的浏览器插件
Stars: ✭ 54 (+260%)
Mutual labels:  zhihu
Alfred Web Search Suggest
Alfred search suggest workflow for various popular websites.
Stars: ✭ 249 (+1560%)
Mutual labels:  zhihu
mpvue-wechat-zhihu
一个入门级别的资讯类微信小程序
Stars: ✭ 25 (+66.67%)
Mutual labels:  zhihu
eve
👻 everyday explore, Github / HackNews / V2EX / Medium / Product Hunt.
Stars: ✭ 13 (-13.33%)
Mutual labels:  zhihu
Webporter
基于 webmagic 的 Java 爬虫应用
Stars: ✭ 2,598 (+17220%)
Mutual labels:  zhihu
KotlinEnjoyLife
😉【乐享】Kotlin 版本 每天一张精选妹纸图、一个精选短视频,知乎美文的精美应用
Stars: ✭ 73 (+386.67%)
Mutual labels:  zhihu
Vue Zhihudaily
🗞 知乎日报 Web 基于 Vue 2.3
Stars: ✭ 213 (+1320%)
Mutual labels:  zhihu
ZhihuMagnifier
Chrome扩展:知乎头像放大器
Stars: ✭ 31 (+106.67%)
Mutual labels:  zhihu
XiaoxiaZhihuWeex
XiaoxiaZhihu(zhihu daily) client written by Weex.
Stars: ✭ 15 (+0%)
Mutual labels:  zhihu
zhihu
搜索你的知乎收藏:可以直观地浏览你的所有收藏夹的内容,并进行全文搜索
Stars: ✭ 39 (+160%)
Mutual labels:  zhihu
zhihu-crawler
徒手实现定时爬取知乎,从中发掘有价值的信息,并可视化爬取的数据作网页展示。
Stars: ✭ 56 (+273.33%)
Mutual labels:  zhihu

zhihu-recover

对知乎已经删除/可能删除的问题备份

知乎删除了问题 "莆田系医院都有哪些内幕?" 从快照恢复并备份了其他几个莆田系相关问题

列表

(404)莆田系医院都有哪些内幕?

(404)福建莆田私人医院的历史是怎么样的?

(404)知乎用户:哪个瞬间让你突然觉得读书真有用? Related video backup

(404)如何评价韩国电影《出租车司机》?

(404)如何评价北航陈小武老师?

(404)如何看待上海环卫工罢工? - 知乎

莆田人为什么这么“精明”

在知乎的医生怎么看待莆田系的医生?

魏则西怎么样了?

从快照恢复知乎页面方法

虽然百度快照对知乎的支持还是很渣的,但几乎可以确定的一点是:删帖不会删图片 至少不会马上删

Ctrl+U查看源代码,发现图片其实是有链接的,只是使用了图片延迟加载的技术,百度快照页面已经过滤掉了js也就导致图片加载不出来;同时知乎的图片是反盗链的,需要设置Referer为zhihu.com才可正常加载

步骤:

1.打开快照页面,Ctrl+U查看源代码,Ctrl+A Ctrl+C全选复制,粘贴到编辑器

2.替换:

src="https://github.com//zhstatic.zhihu.com/assets/zhihu/ztext/whitedot.jpg"替换为空
data-original替换为src

还可能需要视情况修改meta中charset的设置,例如charset=gb2312替换为charset=utf-8

3.打开网页,全页面截图保存

4.(进阶)得到离线版本

使用高级的编辑器(如我用的EmEditor),提取图片网址,正则为:https://pic[0-9].zhimg.com/[^" ]+", 全部选择复制到一个空文档,将"替换为\n,保存文档到tmp.txt

可见tmp.txt中还是有重复的记录,先进行去重后再下载吧:

cat tmp.txt|sort|uniq>piclist.txt
wget -i piclist.txt

下载图片完成后编辑html:找到base标签删除;正则替换https://pic[0-9].zhimg.com/,替换为空

再打开浏览器F12看看有没有不存在的文件,抓出来再下载一遍 over

在发现知乎404后尽快按步骤进行恢复,防止快照过期

欢迎贡献

欢迎PR提交更多已经被删/可能被删的知乎问题的备份文件

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].