Top 395 spider open source projects

jobSpider
jobSpider是一只scrapy爬虫,用于爬取职位信息
youdao
有道词典网页爬虫
python-spider
python爬虫小项目【持续更新】【笔趣阁小说下载、Tweet数据抓取、天气查询、网易云音乐逆向、天天基金网查询、微博数据抓取(生成cookie)、有道翻译逆向、企查查免登陆爬虫、大众点评svg加密破解、B站用户爬虫、拉钩免登录爬虫、自如租房字体加密、知乎问答
learning spider
这其实是一份学习笔记。包括学习记录、爬虫练习平台(网站)、自制工具脚本
QQSpider
爬取QQ用户信息(qq号、昵称、生日、地址等基本信息)并做简要analysis。
Spydan
A web spider for shodan.io without using the Developer API.
landchina-spider
项目已经过时!无法应用在改版后的网站上。
scrapy-distributed
A series of distributed components for Scrapy. Including RabbitMQ-based components, Kafka-based components, and RedisBloom-based components for Scrapy.
douban-movie
Get movie info from douban(豆瓣) and display in your terminal
OpenScraper
An open source webapp for scraping: towards a public service for webscraping
OpenYspider
千万级图片爬虫、视频爬虫 [开源版本] Image Spider
ChineseStarsRelationship
中国明星数据爬取。你甚至可以拿到互联网上所有的人之间的关系,接下来你可以自己发挥!基于这些数据,你可以完成更多有趣的事情。比如说社交网络分析,关系网络可视化,算法研究,和其他有意思的事情。Chinese star data crawling. You can even get all the people on the internet! Based on these data, you can do more interesting things. For example, social network analysis, relational network visualization, algorithm research, and other interesting things.
spider-school
自动答题程序🎉
node-html-crawler
Simple for use node html crawler (spider) of site web pages
Scrapy IPProxyPool
免费 IP 代理池。Scrapy 爬虫框架插件
elves
🎊 Design and implement of lightweight crawler framework.
spider
🌟 powered by python3( simple learning of spider) 百度文库;网易云歌曲; 豆瓣电影; GitHub; 京东; QQ空间; 天气; vip解析助手; TED文本内容; wifi破解脚本; 必应图片设置为桌面等爬取
wget-lua
Wget-AT is a modern Wget with Lua hooks, Zstandard (+dictionary) WARC compression and URL-agnostic deduplication.
163Music
163music spider by scrapy.
qa
😚 Q & A website based on Spring Boot.
nodejs-meizitu
妹子图全站采集10G套图资源
Subbranch-China
银行、支行名称。中国各地区各银行支行名称数据爬虫,数据来源微信商户平台,已经整理可直接导入的sql文件
Sina Spider
新浪爬虫,基于Python+Selenium。模拟登陆后保存cookie,实现登录状态的保存。可以通过输入关键词来爬取到关键词相关的热门微博。
Spider
Spider项目将会不断更新本人学习使用过的爬虫方法!!!
weibo topic
微博话题关键词,个人微博采集, 微博博文一键删除 selenium获取cookie,requests处理
crawler
一个php爬虫
devsearch
A web search engine built with Python which uses TF-IDF and PageRank to sort search results.
Shadow
计算机基础知识,数据结构,设计模式,Tomcat中间件的实现
NScrapy
NScrapy is a .net core corss platform Distributed Spider Framework which provide an easy way to write your own Spider
ICP-Checker
ICP备案查询,可查询企业或域名的ICP备案信息,自动完成滑动验证,保存结果到Excel表格,适用于2022年新版的工信部备案管理系统网站,告别频繁拖动验证,以及某站*工具要开通VIP才可查看备案信息的坑
js block
研究学习各种拦截:反爬虫、拦截ad、防广告注入、斗黄牛等
zhihu-crawler
徒手实现定时爬取知乎,从中发掘有价值的信息,并可视化爬取的数据作网页展示。
yutto
🧊 一个可爱且任性的 B 站视频下载器(bilili V2)
job-spider
多线程爬取互联网行业常用招聘网站
get LibSeat
利昂图书馆预约系统自动预约&签到程序。支持包括中国人民大学、北京师范大学、济南大学、哈尔滨工业大学等在内的38所高校的图书馆系统
ZUCC ZhenFangHelper
正方教务管理系统学生版的自动登录、选课、信息获取
Bilibili manga download
带图形界面的哔哩哔哩漫画下载工具
ComicSpider
动漫之家漫画站电脑版原图爬虫
Tieba-Birthday-Spider
百度贴吧生日爬虫,可抓取贴吧内吧友生日,并且在对应日期自动发送祝福
fetchurls
A bash script to spider a site, follow links, and fetch urls (with built-in filtering) into a generated text file.
bangumi yearly report
No description or website provided.
MoMo
利用墨墨背单词的分享功能拿每日20个的单词上限奖励(多线程
DSpiderDemo-Android
客户端爬虫安卓端demo
feaplat
爬虫管理系统,支持集群,弹性伸缩。支持运行feapder、scrapy、selenium、playwright等各种框架及脚本
TikTokDownloader PyWebIO
🚀「Douyin_TikTok_Download_API」是一个开箱即用的高性能异步抖音|TikTok数据爬取工具,支持API调用,在线批量解析及下载。
crawlerdetect
Golang module to detect bots and crawlers via the user agent
scraper
图片爬取下载工具,极速爬取下载 站酷https://www.zcool.com.cn/, CNU 视觉 http://www.cnu.cc/ 设计师/用户 上传的 图片/照片/插画。
seenreq
Generate an object for testing if a request is sent, request is Mikeal's request.
spider
python 爬虫(amazon, confluence ...)
301-360 of 395 spider projects