All Projects → Guanngxu → Economic_audit_knowledge_graph

Guanngxu / Economic_audit_knowledge_graph

经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定

Programming Languages

javascript
184084 projects - #8 most used programming language
java
68154 projects - #9 most used programming language

Projects that are alternatives of or similar to Economic audit knowledge graph

Web kg
爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱
Stars: ✭ 549 (+460.2%)
Mutual labels:  knowledge-graph, spider, neo4j
ComplexNetwork
中国娱乐圈关系挖掘,可以快速的查询明星之间的关系。This is a complex network of course assignments. The realization of the relationship analysis and visualization of China's entertainment industry, you can quickly query the relationship between the stars
Stars: ✭ 24 (-75.51%)
Mutual labels:  neo4j, knowledge-graph
ChineseStarsRelationship
中国明星数据爬取。你甚至可以拿到互联网上所有的人之间的关系,接下来你可以自己发挥!基于这些数据,你可以完成更多有趣的事情。比如说社交网络分析,关系网络可视化,算法研究,和其他有意思的事情。Chinese star data crawling. You can even get all the people on the internet! Based on these data, you can do more interesting things. For example, social network analysis, relational network visualization, algorithm research, and other interesting things.
Stars: ✭ 26 (-73.47%)
Mutual labels:  spider, knowledge-graph
nlm
Memory for Knowledge Graph, using Neo4j. 知识图谱存储与查询。
Stars: ✭ 43 (-56.12%)
Mutual labels:  neo4j, knowledge-graph
knowledge-graph
Graph Data Visualization Demo| 图数据搜索可视化应用案例
Stars: ✭ 30 (-69.39%)
Mutual labels:  neo4j, knowledge-graph
covid-19-community
Community effort to build a Neo4j Knowledge Graph (KG) that links heterogeneous data about COVID-19
Stars: ✭ 95 (-3.06%)
Mutual labels:  neo4j, knowledge-graph
knowledge-graph-nlp-in-action
从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Information Extraction,Relation Extraction 等任务。
Stars: ✭ 58 (-40.82%)
Mutual labels:  neo4j, knowledge-graph
Stock Knowledge Graph
利用网络上公开的数据构建一个小型的证券知识图谱/知识库
Stars: ✭ 1,182 (+1106.12%)
Mutual labels:  knowledge-graph, neo4j
Kglab
Graph-Based Data Science: an abstraction layer in Python for building knowledge graphs, integrated with popular graph libraries – atop Pandas, RDFlib, pySHACL, RAPIDS, NetworkX, iGraph, PyVis, pslpython, pyarrow, etc.
Stars: ✭ 98 (+0%)
Mutual labels:  knowledge-graph, neo4j
Neo4jupyter
A quick visualization tool for Jupyter and Neo4J
Stars: ✭ 85 (-13.27%)
Mutual labels:  neo4j
Ant nest
Simple, clear and fast Web Crawler framework build on python3.6+, powered by asyncio.
Stars: ✭ 90 (-8.16%)
Mutual labels:  spider
Geziyor
Geziyor, a fast web crawling & scraping framework for Go. Supports JS rendering.
Stars: ✭ 1,246 (+1171.43%)
Mutual labels:  spider
Cesi
WWW 2018: CESI: Canonicalizing Open Knowledge Bases using Embeddings and Side Information
Stars: ✭ 85 (-13.27%)
Mutual labels:  knowledge-graph
Scm Biz Suite
供应链中台系统基础版,集成零售管理, 电子商务, 供应链管理, 财务管理, 车队管理, 仓库管理, 人员管理, 产品管理, 订单管理, 会员管理, 连锁店管理, 加盟管理, 前端React/Ant Design, 后端Java Spring+自有开源框架,全面支持MySQL, PostgreSQL, 全面支持国产数据库南大通用GBase 8s,通过REST接口调用,前后端完全分离。
Stars: ✭ 1,310 (+1236.73%)
Mutual labels:  knowledge-graph
Alipayorderssupervisor Gui
GUI of AlipayOrdersSupervisor, implemented in Java and Swing
Stars: ✭ 85 (-13.27%)
Mutual labels:  spider
Activegraph
An active model wrapper for the Neo4j Graph Database for Ruby.
Stars: ✭ 1,329 (+1256.12%)
Mutual labels:  neo4j
Neo4j
Graphs for Everyone
Stars: ✭ 9,582 (+9677.55%)
Mutual labels:  neo4j
Kgpolicy
Reinforced Negative Sampling over Knowledge Graph for Recommendation, WWW2020
Stars: ✭ 83 (-15.31%)
Mutual labels:  knowledge-graph
Bruteshark
Network Analysis Tool
Stars: ✭ 1,335 (+1262.24%)
Mutual labels:  neo4j
Clojure Graph Resources
A curated list of Clojure resources for dealing with graph-like data.
Stars: ✭ 94 (-4.08%)
Mutual labels:  neo4j

经济责任审计知识图谱

此项目不再维护,由于当时水平有限,里面代码写的极其糟糕,几百行的函数等等都是不符合设计的,希望小伙伴不要把这种习惯带入到自己的代码中。你可以通过从具体案例了解知识图谱构建流程大致了解流程。项目始于 2018-02,终于 2018-05。原本计划毕业后继续整理,奈何自己的懒惰遇上了工作的繁忙,此后便没有继续整理,索性将当时的毕业论文与后期没有完成的书籍贴上来,供大家参考。

写书的计划是我还没有毕业时与电子工业出版编辑找到我希望能写一本书,因为内容中涉及到大量爬虫,而且爬目标网站是政府网站(不允许爬),加之 19 年网上时不时曝出某某程序员因爬虫而入狱的故事,出版社和我难免不会恐惧。

我做毕设时有一部分数据来源于导师,这部分数据属于涉密数据,总之就是各种因素加在一起这本书的出版计划泡汤了,书籍存放的是第一、二、三章的内容,当然前三章还有部分内容没有完成,但主体内容已经完备,是一个不错的参考。

第四章没有写,第五章主要是关于 Neo4J 数据库的相关知识,这些内容您可以通过网络博客轻松查到;第六章计划内容是该知识图谱可视化的实现,准备使用 tornado + vue 重新实现(程序中所给的不是这种实现方式),web 相关的内容你也可以在网上轻松查到,如果您花时间重新实现了 web 程序,欢迎您提交您的代码。

程序

存放经济责任审计知识图谱构建过程中的所有程序

数据

存放最终使用的数据

论文

我的毕业论文

书籍

未写完的书籍

说明

数据来源

所有实体数据来源于互动百科

关系数据分两部分,一部分是从wikidata中直接爬的

另一部分是使用程序抽取的事实三元组,将所有新闻数据和词条解释都进行实体关系抽取

事实三元组抽取程序传送门:基于依存分析的实体关系抽取程序

构建流程

image

效果展示

实体查询

image

image

关系查询

image

image

image

使用

数据文件夹中的数据导入neo4j数据库

实体信息导入程序:https://github.com/mengxiaoxu/economic_audit_knowledge_graph/tree/master/程序/实体信息导入程序

关系数据导入:

# 导入关系数据
LOAD CSV  WITH HEADERS FROM "file:///relation.csv" AS line
MATCH (entity1:Hudong{title:line.Hudong1}) , (entity2:Hudong{title:line.Hudong2})
CREATE (entity1)-[:RELATION { type: line.relation }]->(entity2)

# 添加索引
CREATE CONSTRAINT ON (c:Hudong)
ASSERT c.title IS UNIQUE

可以参考:农业知识图谱说明

感谢

汉语言处理包HanLP

中文文本分类

农业知识图谱

事实三元组抽取

开放中文实体关系抽取

中文自然语言处理相关资料

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].