All Projects → tywei90 → Lmlcspider_production

tywei90 / Lmlcspider_production

🐞 立马理财销售统计(爬虫+页面展示)

Programming Languages

javascript
184084 projects - #8 most used programming language

Projects that are alternatives of or similar to Lmlcspider production

Pholcus
Pholcus is a distributed high-concurrency crawler software written in pure golang
Stars: ✭ 6,990 (+13605.88%)
Mutual labels:  spider
Maman
Rust Web Crawler saving pages on Redis
Stars: ✭ 39 (-23.53%)
Mutual labels:  spider
Fbiwarning
Node.js seed downloader (Node.js 种子神器)
Stars: ✭ 44 (-13.73%)
Mutual labels:  spider
Blackwidow
A Python based web application scanner to gather OSINT and fuzz for OWASP vulnerabilities on a target website.
Stars: ✭ 887 (+1639.22%)
Mutual labels:  spider
Netcloud
NetCloud Web Spider
Stars: ✭ 37 (-27.45%)
Mutual labels:  spider
Lizard
💐 Full Amazon Automatic Download
Stars: ✭ 41 (-19.61%)
Mutual labels:  spider
Easylogin
A python3 package for writing spider more easily.
Stars: ✭ 26 (-49.02%)
Mutual labels:  spider
Reptile
🏀 Python3 网络爬虫实战(部分含详细教程)猫眼 腾讯视频 豆瓣 研招网 微博 笔趣阁小说 百度热点 B站 CSDN 网易云阅读 阿里文学 百度股票 今日头条 微信公众号 网易云音乐 拉勾 有道 unsplash 实习僧 汽车之家 英雄联盟盒子 大众点评 链家 LPL赛程 台风 梦幻西游、阴阳师藏宝阁 天气 牛客网 百度文库 睡前故事 知乎 Wish
Stars: ✭ 1,048 (+1954.9%)
Mutual labels:  spider
App comments spider
爬取百度贴吧、TapTap、appstore、微博官方博主上的游戏评论(基于redis_scrapy),过滤器采用了bloomfilter。
Stars: ✭ 38 (-25.49%)
Mutual labels:  spider
Photon
Incredibly fast crawler designed for OSINT.
Stars: ✭ 8,332 (+16237.25%)
Mutual labels:  spider
Jspider
JSpider会每周更新至少一个网站的JS解密方式,欢迎 Star,交流微信:13298307816
Stars: ✭ 914 (+1692.16%)
Mutual labels:  spider
Nodespider
[DEPRECATED] Simple, flexible, delightful web crawler/spider package
Stars: ✭ 33 (-35.29%)
Mutual labels:  spider
Crawlab
Distributed web crawler admin platform for spiders management regardless of languages and frameworks. 分布式爬虫管理平台,支持任何语言和框架
Stars: ✭ 8,392 (+16354.9%)
Mutual labels:  spider
Go Demo
Go语言实例教程从入门到进阶,包括基础库使用、设计模式、面试易错点、工具类、对接第三方等
Stars: ✭ 881 (+1627.45%)
Mutual labels:  spider
Django Dynamic Scraper
Creating Scrapy scrapers via the Django admin interface
Stars: ✭ 1,024 (+1907.84%)
Mutual labels:  spider
Douban spider
一个简单的豆瓣信息爬虫😄
Stars: ✭ 8 (-84.31%)
Mutual labels:  spider
Wechat articles spider
微信公众号文章的爬虫
Stars: ✭ 993 (+1847.06%)
Mutual labels:  spider
Cloudmusic
网易云爬虫解决方案
Stars: ✭ 51 (+0%)
Mutual labels:  spider
Super Spider
根据腾讯安全应急响应中心的架构编写的一款超强爬虫(广度优先搜索)
Stars: ✭ 48 (-5.88%)
Mutual labels:  spider
Avbook
AV 电影管理系统, avmoo , javbus , javlibrary 爬虫,线上 AV 影片图书馆,AV 磁力链接数据库,Japanese Adult Video Library,Adult Video Magnet Links - Japanese Adult Video Database
Stars: ✭ 8,133 (+15847.06%)
Mutual labels:  spider

基于 nodejs 的立马理财爬虫项目

要是觉得这个项目还不错,别忘记star哦

技术分析,详见我的博客

线上地址:点击这里

一、工程目录分析

data是爬虫爬取数据后存储的文件夹

dist是前端js、css打包的目录

public存放一些公共文件

server是后台代码目录

  • user.js是首页用户购买ajax接口爬虫代码
  • product.js是理财页产品ajax接口爬虫代码
  • record.js是详情页投资记录同步页面爬虫代码
  • getCookie.js是测试爬虫带cookie模拟登录代码
  • dataHandle.js是处理数据得到销售额的代码
  • lmlcSpider.js是将上述爬虫代码整合在一起的最终线上用的爬虫代码

spider存放爬虫代码的目录

src前端工程目录

views存放html模板

二、项目运行

  1. 下载chrome插件LiveReload

  2. 修改views文件夹里的index.html和detail.html文件。

  • 如果是本地调试,index.js都要改成http://localhost:8080/dist/index.js
  • 如果是其他设备访问,则改成your_ip_addr:5000/dist/index.js
  • index.css一样。
  1. 运行方式
npm run dev
npm run server // 启动后台
npm run spider your_username your_password // 启动爬虫
  1. 测试学习各页面的爬虫代码
npm run user  // 爬取立马理财首页的用户购买信息ajax接口
npm run product  // 爬取立马理财理财页所有产品的ajax接口
npm run record  // 爬取立马理财产品详情页的投资记录同步页面数据

注意

开启爬虫需要带网易立马理财登录的账号和密码参数。当然如果有网易邮箱,可以直接输入网易邮箱和密码即可。

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].