Cheap and reliable Node.js hosting starts at $3/month, and $1/month static HTML hosting

小说精品屋是一个多平台（web、安卓app、微信小程序）、功能完善的屏幕自适应小说漫画连载系统，包含精品小说专区、轻小说专区和漫画专区。包括小说/漫画分类、小说/漫画搜索、小说/漫画排行、完本小说/漫画、小说/漫画评分、小说/漫画在线阅读、小说/漫画书架、小说/漫画阅读记录、小说下载、小说弹幕、小说/漫画自动采集/更新/纠错、小说内容自动分享到微博、邮件自动推广、链接自动推送到百度搜索引擎等功能。

Stars: ✭ 2,710 (+1166.36%)

Mutual labels: spider

Scrapydweb

Web app for Scrapyd cluster management, Scrapy log analysis & visualization, Auto packaging, Timer tasks, Monitor & Alert, and Mobile UI. DEMO 👉

Stars: ✭ 2,385 (+1014.49%)

Mutual labels: spider

Ok ip proxy pool

🍿爬虫代理IP池(proxy pool) python🍟一个还ok的IP代理池

Stars: ✭ 196 (-8.41%)

Mutual labels: spider

Querylist

🕷️ The progressive PHP crawler framework! 优雅的渐进式PHP采集框架。

Stars: ✭ 2,392 (+1017.76%)

Mutual labels: spider

Python Script

My Python Script

Stars: ✭ 182 (-14.95%)

Mutual labels: spider

Dht

BitTorrent DHT Protocol && DHT Spider.

Stars: ✭ 2,459 (+1049.07%)

Mutual labels: spider

Portia Dashboard

portia-dashboard is a visual web crawler based on scrapinghub/portia

Stars: ✭ 199 (-7.01%)

Mutual labels: spider

Wereader

一个功能全面的微信读书爬虫 wereader

Stars: ✭ 207 (-3.27%)

Mutual labels: spider

Goribot

[Crawler/Scraper for Golang]🕷A lightweight distributed friendly Golang crawler framework.一个轻量的分布式友好的 Golang 爬虫框架。

Stars: ✭ 190 (-11.21%)

Mutual labels: spider

Fooproxy

稳健高效的评分制-针对性- IP代理池 + API服务，可以自己插入采集器进行代理IP的爬取，针对你的爬虫的一个或多个目标网站分别生成有效的IP代理数据库，支持MongoDB 4.0 使用 Python3.7（Scored IP proxy pool ,customise proxy data crawler can be added anytime）

Stars: ✭ 195 (-8.88%)

Mutual labels: spider

Jssoup

JavaScript + BeautifulSoup = JSSoup

Stars: ✭ 203 (-5.14%)

Mutual labels: spider

Videospider

抓取豆瓣，bilibili等中的电视剧、电影、动漫演员等信息

Stars: ✭ 186 (-13.08%)

Mutual labels: spider

Py Elasticsearch Django

基于python语言开发的千万级别搜索引擎

Stars: ✭ 207 (-3.27%)

Mutual labels: spider

Lianjia Beike Spider

链家网和贝壳网房价爬虫，采集北京上海广州深圳等21个中国主要城市的房价数据（小区，二手房，出租房，新房），稳定可靠快速！支持csv,MySQL, MongoDB,Excel, json存储，支持Python2和3，图表展示数据，注释丰富，点星支持，仅供学习参考，请勿用于商业用途，后果自负。

Stars: ✭ 2,257 (+954.67%)

Mutual labels: spider

Zhihuspider

多线程知乎用户爬虫，基于python3

Stars: ✭ 201 (-6.07%)

Mutual labels: spider

Biliutil

Bilibili.com视频批量下载工具包

Stars: ✭ 212 (-0.93%)

Mutual labels: spider

Gerapy

Distributed Crawler Management Framework Based on Scrapy, Scrapyd, Django and Vue.js

Stars: ✭ 2,601 (+1115.42%)

Mutual labels: spider

Colly

Elegant Scraper and Crawler Framework for Golang

Stars: ✭ 15,535 (+7159.35%)

Mutual labels: spider

View All Similar Projects ➔

LSpider

LSpider - 一个为被动扫描器定制的前端爬虫

什么是LSpider?

一款为被动扫描器而生的前端爬虫~

由Chrome Headless、LSpider主控、Mysql数据库、RabbitMQ、被动扫描器5部分组合而成。

(1) 建立在Chrome Headless基础上，将模拟点击和触发事件作为核心原理，通过设置代理将流量导出到被动扫描器。

(2) 通过内置任务+子域名api来进行发散式的爬取，目的经可能的触发对应目标域的流量。

(3) 通过RabbitMQ来进行任务管理，支持大量线程同时任务。

(4) 智能填充表单，提交表单等。

(5) 通过一些方式智能判断登录框，并反馈给使用者，使用者可以通过添加cookie的方式来完成登录。

(6) 定制了相应的Webhook接口，以供Webhook统计发送到微信。

(7) 内置了Hackerone、bugcrowd爬虫，提供账号的情况下可以一键获取某个目标的所有范围。

为什么选择LSpider?

LSpider是专门为被动扫描器定制的爬虫，许多功能都是为被动扫描器而服务的。

建立在RabbitMQ的任务管理系统相当稳定，可以长期在无人监管的情况下进行发散式的爬取。

LSpider的最佳实践是什么？

服务器1（2c4g以上）: Nginx + Mysql + Mysql管理界面（phpmyadmin）

将被动扫描器的输出位置设置为web路径下，这样可以通过Web同时管理结果以及任务。

LSpider部署5线程以上，设置代理连接被动扫描器（被动扫描器可以设置专门的漏扫代理）

服务器2（非必要，但如果部署在服务器1，那么就需要更好的配置）：RabbitMQ

还有什么问题？

LSpider从设计之初是为了配合像xray这种被动扫描器而诞生的，但可惜的是，在工具发展的过程中，深刻认识到爬虫是无法和被动扫描器拆分开来的。

强行将应该在被动扫描器实现的功能在爬虫端实现简直是舍本逐末，所以我们发起了另一个被动扫描器项目，如果有机会，后续还会开源出来给大家。

设计思路？

为被动扫描器量身打造一款爬虫-LSpider

Usage

安装&使用

你可以通过下面的命令来测试是否安装成功

python3 manage.py SpiderCoreBackendStart --test

通过dockerfile安装（不推荐的安装模式）

cd ./docker

docker-compose up -d

dockerfile 安装&使用

使用dockerfile安装，推荐修改其中必要的配置信息以避免安全漏洞诞生。

值得注意的是，以下脚本可能会涉及到项目路径影响，使用前请修改相应的配置

建议配合screen来挂起进程

启动LSpider webhook 与漏洞展示页面（默认端口2062）

./lspider_webhook.sh

启动LSpider

./lspider_start.sh

完全关闭LSpider

./lspider_stop.sh

启动被动扫描器

./xray.sh

一些关键的配置

配置说明

如何配置扫描任务以及其他的配置相关

其中包含了如何配置扫描任务、鉴权信息、webhook。

值得注意的是，文中提到的Cookie配置，格式为浏览器请求包复制即可。

如何配置扫描任务以及其他的配置相关

扫描器结果输出到配置文件相同目录（默认为vuls/）,则可以通过web界面访问。

使用内置的hackerone、bugcrowd爬虫获取目标

使用hackerone爬虫，你需要首先配置好hackerone账号

 python3 .\manage.py HackeroneSpider {appname}

同理，bugcrowd使用

 python3 .\manage.py BugcrowdSpider {appname}

Contributors

感谢如下贡献者对本工具发展过程中的贡献：

404StarLink

LSpider 是 404Team 星链计划中的一环，如果对LSpider有任何疑问又或是想要找小伙伴交流，可以参考星链计划的加群方式。

https://github.com/knownsec/404StarLink-Project#community

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].

Stars: ✭ 214

Visit Git Page 🔗Visit User Page 🔗Visit Issues Page (2) 🔗

Cheap and reliable Node.js hosting starts at $3/month, and $1/month static HTML hosting

knownsec / Lspider

Programming Languages

Labels

Projects that are alternatives of or similar to Lspider

LSpider

什么是LSpider?

为什么选择LSpider?

LSpider的最佳实践是什么？

还有什么问题？

设计思路？

Usage

一些关键的配置

如何配置扫描任务 以及 其他的配置相关

使用内置的hackerone、bugcrowd爬虫获取目标

Contributors

404StarLink

如何配置扫描任务以及其他的配置相关