Crawling zhihu, jobbole, lagou by Scrapy, and using Elasticsearch+Django to build a Search Engine website --- README_zh.md (including: implementation roadmap, distributed-crawler and coping with anti-crawling strategies).

Stars: ✭ 34 (-59.52%)

Mutual labels: scrapy

worker-template-postgres

Reference demo and modified PostgreSQL driver to connect Cloudflare Workers to a relational database.

Stars: ✭ 75 (-10.71%)

Mutual labels: cloudflare

systemd-cfddns

Bash-powered DDNS client for Cloudflare-managed domain

Stars: ✭ 29 (-65.48%)

Mutual labels: cloudflare

pararius-apartment-hunting-dashboard

🏡 A NodeJS server to scrape Pararius listings and show them in a dashboard 🏘️

Stars: ✭ 37 (-55.95%)

Mutual labels: scrapping

cloudflareddns

DDNS with Cloudflare

Stars: ✭ 33 (-60.71%)

Mutual labels: cloudflare

Actual Domain Prices

The real cost of each TLD (top-level-domain). Find out how much your registrar marks up your domain prices.

Stars: ✭ 247 (+194.05%)

Mutual labels: cloudflare

Bugs-feed

Bug's feed is a local hosted portal where you can search for the latest news, videos, CVEs, vulnerabilities...

Stars: ✭ 90 (+7.14%)

Mutual labels: scrapping

RARBG-scraper

With Selenium headless browsing and CAPTCHA solving

Stars: ✭ 38 (-54.76%)

Mutual labels: scrapy

vietnam-ecommerce-crawler

Crawling the data from lazada, websosanh, compare.vn, cdiscount and cungmua with flexible configs

Stars: ✭ 28 (-66.67%)

Mutual labels: scrapy

Raspagem-de-dados-para-iniciantes

Raspagem de dados para iniciante usando Scrapy e outras libs básicas

Stars: ✭ 113 (+34.52%)

Mutual labels: scrapy

crawler

python爬虫项目集合

Stars: ✭ 29 (-65.48%)

Mutual labels: scrapy

akamai-toolkit

A set of tools to work on Akamai v1 anti-bot solution. Current supported version: 1.70

Stars: ✭ 215 (+155.95%)

Mutual labels: anti-bot

Web-Iota

Iota is a web scraper which can find all of the images and links/suburls on a webpage

Stars: ✭ 60 (-28.57%)

Mutual labels: scrapy

IPFS PHOTO SHARE

💰用甚嚒服务器，ServerLess搭建一个图片分享站点！| 基于CloudFlareWorker无服务器函数和IPFS去中心化存储的图片分享网站

Stars: ✭ 76 (-9.52%)

Mutual labels: cloudflare

scrapy helper

Dynamic configurable crawl (动态可配置化爬虫)

Stars: ✭ 84 (+0%)

Mutual labels: scrapy

scrapy-mysql-pipeline

scrapy mysql pipeline

Stars: ✭ 47 (-44.05%)

Mutual labels: scrapy

cloudflare-ddns

A script to update your Cloudflare DNS records at a glance.

Stars: ✭ 152 (+80.95%)

Mutual labels: cloudflare

domin

Domain Name Search untuk mencari ketersedian nama domain.

Stars: ✭ 17 (-79.76%)

Mutual labels: cloudflare

Scrapy-tripadvisor-reviews

Using scrapy to scrape tripadvisor in order to get users' reviews.

Stars: ✭ 24 (-71.43%)

Mutual labels: scrapy

fernando-pessoa

Classificador de poemas do Fernando Pessoa de acordo com os seus heterônimos

Stars: ✭ 31 (-63.1%)

Mutual labels: scrapy

cloudflare-block-bad-bot-ruleset

🚦 Block malicious crawlers with Cloudflare Firewall Rules

Stars: ✭ 178 (+111.9%)

Mutual labels: cloudflare

small-spider-project

日常爬虫

Stars: ✭ 14 (-83.33%)

Mutual labels: scrapy

pagser

Pagser is a simple, extensible, configurable parse and deserialize html page to struct based on goquery and struct tags for golang crawler

Stars: ✭ 82 (-2.38%)

Mutual labels: scrapy

scrapy-wayback-machine

A Scrapy middleware for scraping time series data from Archive.org's Wayback Machine.

Stars: ✭ 92 (+9.52%)

Mutual labels: scrapy

domains

World’s single largest Internet domains dataset

Stars: ✭ 461 (+448.81%)

Mutual labels: scrapy

workers-unsplash-api

Serverless API for requesting images from Unsplash's API, designed for use with a React frontend

Stars: ✭ 20 (-76.19%)

Mutual labels: cloudflare

cloudflare-worker-router

A super lightweight router (1.3K) with middleware support and ZERO dependencies for CloudFlare Workers.

Stars: ✭ 144 (+71.43%)

Mutual labels: cloudflare

purge-cf-cache-chrome-extension

A chrome extension that purges the CF cache for the current URL of CloudFlare enabled websites

Stars: ✭ 22 (-73.81%)

Mutual labels: cloudflare

ceil

Helmut Hoffer von Ankershoffen experimenting with auto-provisioned RPi cluster running K8S on bare-metal

Stars: ✭ 42 (-50%)

Mutual labels: cloudflare

scrapy-fieldstats

A Scrapy extension to log items coverage when the spider shuts down

Stars: ✭ 17 (-79.76%)

Mutual labels: scrapy

cloudflare-ddns-script

CloudFlare ddns / 树莓派IPV6 DDNS解决方案

Stars: ✭ 94 (+11.9%)

Mutual labels: cloudflare

warp-up

Automatically generated referrer bonuses for Cloudflare WARP (https://1.1.1.1)

Stars: ✭ 24 (-71.43%)

Mutual labels: cloudflare

DDos-Attack-OVH-

Powerful DDoS Attack

Stars: ✭ 155 (+84.52%)

Mutual labels: cloudflare

html2data

Library and cli for extracting data from HTML via CSS selectors

Stars: ✭ 62 (-26.19%)

Mutual labels: scrapping

Flaresolverr

Proxy server to bypass Cloudflare protection

Stars: ✭ 241 (+186.9%)

Mutual labels: cloudflare

double-agent

A test suite of common scraper detection techniques. See how detectable your scraper stack is.

Stars: ✭ 123 (+46.43%)

Mutual labels: scrapy

cloudflared

Cloudflare Tunnel Instructions and Template for Unraid

Stars: ✭ 129 (+53.57%)

Mutual labels: cloudflare

Scrapy-SearchEngines

bing、google、baidu搜索引擎爬虫。python3.6 and scrapy

Stars: ✭ 28 (-66.67%)

Mutual labels: scrapy

easypoi

简单、免费、高效的百度地图poi采集和分析工具。

Stars: ✭ 87 (+3.57%)

Mutual labels: scrapy

scrapy-kafka-redis

Distributed crawling/scraping, Kafka And Redis based components for Scrapy

Stars: ✭ 45 (-46.43%)

Mutual labels: scrapy

1-60 of 438 similar projects

›

next*5