All Projects → zhao94254 → Yspider

zhao94254 / Yspider

yspider -- 轻量级爬虫系统

Projects that are alternatives of or similar to Yspider

Eve
REST API framework designed for human beings
Stars: ✭ 6,421 (+5036.8%)
Mutual labels:  mongodb, flask
Docker Flask Mongodb Example
Uses docker compose with a python flask microservice and MongoDB instance to make a sample application
Stars: ✭ 49 (-60.8%)
Mutual labels:  mongodb, flask
Social Listener
Python project used to collect tweets and social-network data from Social's API
Stars: ✭ 9 (-92.8%)
Mutual labels:  mongodb, flask
Osroom
[很多问题在维修中, 作者疫情期间忙碌,很多问题无法及时处理] 准备v3.0 Beta, v2.2维护少| OS鹿 | Python Flask开源网站
Stars: ✭ 557 (+345.6%)
Mutual labels:  mongodb, flask
Awesome Python Primer
自学入门 Python 优质中文资源索引,包含 书籍 / 文档 / 视频,适用于 爬虫 / Web / 数据分析 / 机器学习 方向
Stars: ✭ 57 (-54.4%)
Mutual labels:  spider, flask
Python Spider
豆瓣电影top250、斗鱼爬取json数据以及爬取美女图片、淘宝、有缘、CrawlSpider爬取红娘网相亲人的部分基本信息以及红娘网分布式爬取和存储redis、爬虫小demo、Selenium、爬取多点、django开发接口、爬取有缘网信息、模拟知乎登录、模拟github登录、模拟图虫网登录、爬取多点商城整站数据、爬取微信公众号历史文章、爬取微信群或者微信好友分享的文章、itchat监听指定微信公众号分享的文章
Stars: ✭ 615 (+392%)
Mutual labels:  spider, mongodb
P2p
一个基于 python 的 flask 框架的资讯网站, http://119.29.100.53:8086/
Stars: ✭ 28 (-77.6%)
Mutual labels:  mongodb, flask
Octblog
Yet another blog system powered by Flask and MongoDB
Stars: ✭ 421 (+236.8%)
Mutual labels:  mongodb, flask
Eve Building Restful Mongodb Backed Apis Course
Course materials and handouts for EVE: Building RESTful MongoDB-backed APIs course
Stars: ✭ 53 (-57.6%)
Mutual labels:  mongodb, flask
Openclubhouse
A third-part web application based on flask to play Clubhouse audio.
Stars: ✭ 1,061 (+748.8%)
Mutual labels:  mongodb, flask
Bdp Dataplatform
大数据生态解决方案数据平台:基于大数据、数据平台、微服务、机器学习、商城、自动化运维、DevOps、容器部署平台、数据平台采集、数据平台存储、数据平台计算、数据平台开发、数据平台应用搭建的大数据解决方案。
Stars: ✭ 456 (+264.8%)
Mutual labels:  spider, mongodb
Flask Restful Authentication
An example for RESTful authentication using nginx, uWSGI, Flask, MongoDB and JSON Web Token(JWT).
Stars: ✭ 63 (-49.6%)
Mutual labels:  mongodb, flask
Pb
pb is a formerly-lightweight pastebin and url shortener
Stars: ✭ 448 (+258.4%)
Mutual labels:  mongodb, flask
Istock
👉一个基于spring boot 实现的java股票爬虫(仅支持A股),如果你❤️请⭐️ . V2升级版正在开发中!
Stars: ✭ 622 (+397.6%)
Mutual labels:  spider, mongodb
Qqzonemood
QQZone mood spider and analysis. QQ空间多线程爬虫和数据挖掘。提供线上服务,扫码登陆即可自动爬取和分析数据,还有网易云年度报告风格的数据展示;使用docker-compose打包程序,方便部署;额外提供QQ空间抽奖小程序。
Stars: ✭ 439 (+251.2%)
Mutual labels:  spider, flask
Bibi
An e-commerce fullstack solution for Flask 出口电商全栈解决方案
Stars: ✭ 914 (+631.2%)
Mutual labels:  mongodb, flask
Gokv
Simple key-value store abstraction and implementations for Go (Redis, Consul, etcd, bbolt, BadgerDB, LevelDB, Memcached, DynamoDB, S3, PostgreSQL, MongoDB, CockroachDB and many more)
Stars: ✭ 314 (+151.2%)
Mutual labels:  mongodb, abstraction
Data Driven Web Apps With Flask
Course demo code and other hand-out materials for our data-driven web apps in Flask course
Stars: ✭ 388 (+210.4%)
Mutual labels:  mongodb, flask
Restfulapi
flask-restful 中小型项目实例
Stars: ✭ 50 (-60%)
Mutual labels:  mongodb, flask
Todo List Using Flask And Mongodb
Simple implementation of ToDo List using Flask and MongoDB along with Dockerfile and Kubernetes yaml files #Flask #Example #Docker #Kubernetes #k8s
Stars: ✭ 61 (-51.2%)
Mutual labels:  mongodb, flask

目的 -。-

抽象练习,搞点有意思的东西。

结构

example 是使用yspider的例子。
server 是web程序
tests 一些测试
yspider 主要框架
worker.py 运行任务队列

抽象

请求 --(framework)-- 解析 -- 保存

基本的功能

在框架这里将请求 响应中间的过程都处理好。包括重试,代理,并发控制,等。
通过框架只需要将自己的业务逻辑搞好就可以。专注于解析 和 构造请求上面。

通过提供的web服务能够将一些易于解析的直接用web传入。 只需要找接口,和对应的解析规则即可。

例子 : 见tests文件下的 test_register_login。   

buffer 将一些数据buffer掉,降低写入次数。

并发 直接使用了 线程池。

一个问题。

还是之前的问题,在yspider.spider中启用多线程的使用在外面包装了一层函数,这个是为了将生成器包起来,否则就需要自己来管理
调度,不管理的话会把整个检查阻塞掉。管理调度很麻烦。包装一层后就变成了系统级的线程,不用自己调度。

todo

增加一个任务分发功能

按照融合好的任务进行分发。

增加队列,请求异步化。

思考保存web端的一些数据,保存爬下来的数据。将不同用户的不同数据返回。

数据融合?

将多个源的任务组合。 比如获取多个酒店的信息,去获取最低价。

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].