All Projects → 1061700625 → Wechat_article

1061700625 / Wechat_article

爬取微信公众号文章

Programming Languages

python
139335 projects - #7 most used programming language
python3
1442 projects

Projects that are alternatives of or similar to Wechat article

Weixin Spider
微信公众号爬虫,公众号历史文章,文章评论,文章阅读及在看数据,可视化web页面,可部署于Windows服务器。基于Python3之flask/mysql/redis/mitmproxy/pywin32等实现,高效微信爬虫,微信公众号爬虫,历史文章,文章评论,数据更新。
Stars: ✭ 287 (+137.19%)
Mutual labels:  spider, wechat
Examples Of Web Crawlers
一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )
Stars: ✭ 10,724 (+8762.81%)
Mutual labels:  spider, wechat
Cleanmywechat
自动删除 PC 端微信缓存数据,包括从所有聊天中自动下载的大量文件、视频、图片等数据内容,解放你的空间。
Stars: ✭ 816 (+574.38%)
Mutual labels:  wechat, pyqt5
Article spider
微信公众号爬虫
Stars: ✭ 235 (+94.21%)
Mutual labels:  spider, wechat
Movieheavens
🎬 基于Pyqt5的简单电影搜索工具
Stars: ✭ 465 (+284.3%)
Mutual labels:  spider, pyqt5
Wechat articles spider
微信公众号文章的爬虫
Stars: ✭ 993 (+720.66%)
Mutual labels:  spider, wechat
Wechatbot4xianyu
🤖 微信订阅机器人 | 🐟 微信订阅机器人之闲鱼二手商品监控
Stars: ✭ 56 (-53.72%)
Mutual labels:  spider, wechat
Wechatrobot
个人微信号自动回复、陪聊、查天气、查垃圾分类。新增查看今日新闻和知乎热榜功能。
Stars: ✭ 115 (-4.96%)
Mutual labels:  wechat
Beautycamera
美颜相机,具有人脸检测、磨皮美白人脸、滤镜、调节图片、摄像功能
Stars: ✭ 117 (-3.31%)
Mutual labels:  pyqt5
Douban Movie
Golang爬虫 爬取豆瓣电影Top250
Stars: ✭ 114 (-5.79%)
Mutual labels:  spider
Free proxy website
获取免费socks/https/http代理的网站集合
Stars: ✭ 119 (-1.65%)
Mutual labels:  spider
Copybook
用爬虫爬取小说网站上所有小说,存储到数据库中,并用爬到的数据构建自己的小说网站
Stars: ✭ 117 (-3.31%)
Mutual labels:  spider
Geetest
滑动验证码,希望对你们有所帮助❤️
Stars: ✭ 114 (-5.79%)
Mutual labels:  spider
Wechatpay Postman Script
微信支付API v3的调试工具
Stars: ✭ 112 (-7.44%)
Mutual labels:  wechat
Decryptlogin
APIs for loginning some websites by using requests.
Stars: ✭ 1,861 (+1438.02%)
Mutual labels:  spider
Bilibili member crawler
B站用户爬虫 好耶~是爬虫
Stars: ✭ 115 (-4.96%)
Mutual labels:  spider
Laravel Template
RESTful 模板,企业号/企业微信微信扫码登录/同步通讯录——Laravel vue2 iView
Stars: ✭ 119 (-1.65%)
Mutual labels:  wechat
Galacteek
Browser for the distributed web
Stars: ✭ 114 (-5.79%)
Mutual labels:  pyqt5
Thinkservice
【新】多商户服务平台
Stars: ✭ 116 (-4.13%)
Mutual labels:  wechat
Paperweekly forum
paperweekly's forum
Stars: ✭ 118 (-2.48%)
Mutual labels:  wechat

WeChat_Article

爬取微信公众号文章

WX_Article.exe为最最原始的版本,不再更新;真正的程序在py文件夹里!!!!!!!!

注意,除非你要断点续传,否则删除目录下conf.ini和url.json再启动!!!!

爬取微信公众号有三种方法:
第一种:用搜狗微信公众号搜过,这个只能收到前10条;
第二种:用fiddler或手机抓包,从访问链接去获得appmsg_token,发现虽然这个值就在html页面里,但只有抓包的数据里含有效值,直接访问的是空的,而且还有时效性。这样,每次都要抓包获取,就很麻烦。
第三种:就是这种用公众号搜公众号的,虽然速度慢点,但便捷了不少。

exe文件试用:
https://www.lanzous.com/b824519/ 密码:962h


  • 程序原理:
    通过selenium登录获取token和cookie,再自动爬取和下载
  • 使用前提:
    1、电脑已装Firefox、Chrome、Opera、Edge等浏览器(默认使用火狐驱动)
    2、下载selenium驱动放入python安装目录,将目录添加至环境变量(https://www.seleniumhq.org/download/)
    3、申请一个微信公众号(https://mp.weixin.qq.com)

  • 更新记录:
  1. 下载文章文字内容到txt
  2. 下载文章图片
  3. 保存HTML文件,并将图片链接指向本地
  4. 添加按时间范围下载
  5. 添加cookie登陆,不成功才selenium浏览器登陆
  6. 增加记住密码功能
  7. 修复一些问题,如requests卡死
  8. 添加按关键词下载
  9. 多线程优化下载速度
  10. 增加断点续传功能(可能存在bug,欢迎提issue)
  11. 拟增加备用公众号功能(暂未完成)

建议主程序放到./Py文件夹里运行。若运行仍报错,可:

  1. 可以把这个exe文件拷贝到qt的安装目录下的bin目录下运行即可;
  2. 把bin目录下的Qt5Core.dll, Qt5Gui.dll, Qt5Widgets.dll以及C:\Qt\Qt5.8.0\5.8\msvc2015\plugins\platforms拷贝到exe同级目录。platforms文件夹下有qminimal.dll, qoffscreen.dll, qwindows.dll. 再次运行exe或重新用pyinstaller生成exe。 .
    .
    .
    欢迎关注微信公众号:xfxuezhang
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].