叶子浏览器,基于Cef,访问网页时自动抓取结构化xhr数据
当下许多系统采用前后端分离架构,前端通过Ajax(xhr)向后端请求json数据,叶子浏览器能够自动识别结构化json数据,遇到列表式数据时,自动保存为csv文件!
例如,访问一个extjs设计的公告查询系统,后台xhr请求数据,并具有反爬技术。
只需要使用叶子浏览器访问一次站点,并进行数据搜索,后台即可自动抓取数据并保存为Csv文件。
新生命开源项目矩阵
项目 | 年份 | 状态 | .NET Core | 说明 |
---|---|---|---|---|
NewLife.Core | 2002 | 维护中 | √ | 日志、网络、RPC、序列化、缓存、多线程 |
XCode | 2005 | 维护中 | √ | 数据中间件,MySQL、SQLite、SqlServer、Oracle |
NewLife.Cube | 2010 | 维护中 | √ | Web魔方,权限基础框架,集成OAuth |
NewLife.Redis | 2017 | 维护中 | √ | Redis客户端,微秒级延迟,百亿级项目验证 |
NewLife.RocketMQ | 2018 | 维护中 | √ | 支持Apache RocketMQ和阿里云消息队列 |
NewLife.MQ | 2016 | 维护中 | √ | 轻量级消息队列 |
Stardust | 2018 | 开发中 | √ | 星尘,微服务平台,学习Dubbo |
XAgent | 2008 | 重构中 | √ | 集群节点分布式计算平台,学习Hadoop |
AntJob | 2019 | 开发中 | √ | 蚂蚁调度系统,大数据实时计算平台 |
NoDb | 2017 | 开发中 | √ | NoSQL数据库,百万级读写性能,学习Redis+MongoDB |
NewLife.Cache | 2018 | 维护中 | √ | 自定义缓存服务器 |
XLink | 2016 | 维护中 | √ | 物联网云平台 |
NewLife.Net | 2005 | 维护中 | √ | 网络库,千万级吞吐率,学习gRPC、Thrift |
XCoder | 2006 | 维护中 | × | 码神工具,开发者必备 |
XProxy | 2005 | 维护中 | √ | 产品级反向代理 |
XScript | 2010 | 维护中 | × | C#脚本引擎 |
XTemplate | 2008 | 维护中 | × | 模版引擎,学习TT |
NewLife.DNS | 2011 | 维护中 | × | DNS代理服务器 |
NewLife.CMX | 2013 | 维护中 | × | 内容管理系统 |
SmartOS | 2014 | 保密中 | C++11 | 嵌入式操作系统,面向ARM Cortex-M芯片架构 |
GitCandy | 2015 | 维护中 | × | Git管理系统 |
NewLife.MySql | 2018 | 开发中 | √ | MySql驱动 |
X组件 .NET2.0 | 2002 | 存档中 | .NET2.0 | 日志、网络、RPC、序列化、缓存、Windows服务、多线程 |
X组件 .NET4.0 | 2002 | 存档中 | .NET4.0 | 日志、网络、RPC、序列化、缓存、Windows服务、多线程 |
新生命开发团队
新生命团队始于2002年,部分开源项目具有15年以上漫长历史,源码库保留有2010年以来所有修改记录,并一直保持更新,请确保获取得到最新版本源代码
网站:http://www.NewLifeX.com
国内:http://git.NewLifeX.com
国外:https://github.com/NewLifeX
博客:https://nnhy.cnblogs.com
QQ群:1600800/1600838