All Projects → kidden → Nlp4han

kidden / Nlp4han

中文自然语言处理工具集【断句/分词/词性标注/组块/句法分析/语义分析/NER/N元语法/HMM/代词消解/情感分析/拼写检查】

Programming Languages

java
68154 projects - #9 most used programming language

Projects that are alternatives of or similar to Nlp4han

Zhparser
zhparser is a PostgreSQL extension for full-text search of Chinese language
Stars: ✭ 418 (+102.91%)
Mutual labels:  chinese, chinese-nlp
Chinese Xinhua
📙 中华新华字典数据库。包括歇后语,成语,词语,汉字。
Stars: ✭ 8,705 (+4125.73%)
Mutual labels:  chinese, chinese-nlp
Nlp chinese corpus
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
Stars: ✭ 6,656 (+3131.07%)
Mutual labels:  chinese, chinese-nlp
Chinese financial sentiment dictionary
A Chinese financial sentiment word dictionary
Stars: ✭ 67 (-67.48%)
Mutual labels:  sentiment-analysis, chinese
Lac
百度NLP:分词,词性标注,命名实体识别,词重要性
Stars: ✭ 2,792 (+1255.34%)
Mutual labels:  chinese-nlp, chinese-word-segmentation
chinese-nlp-ner
一套针对中文实体识别的BLSTM-CRF解决方案
Stars: ✭ 14 (-93.2%)
Mutual labels:  chinese, chinese-nlp
Cnn Question Classification Keras
Chinese Question Classifier (Keras Implementation) on BQuLD
Stars: ✭ 28 (-86.41%)
Mutual labels:  chinese, chinese-nlp
CLUEmotionAnalysis2020
CLUE Emotion Analysis Dataset 细粒度情感分析数据集
Stars: ✭ 3 (-98.54%)
Mutual labels:  sentiment-analysis, chinese
Zhopenie
Chinese Open Information Extraction (Tree-based Triple Relation Extraction Module)
Stars: ✭ 98 (-52.43%)
Mutual labels:  chinese, chinese-nlp
Chinesenlp
Datasets, SOTA results of every fields of Chinese NLP
Stars: ✭ 1,206 (+485.44%)
Mutual labels:  chinese-nlp, chinese-word-segmentation
berserker
Berserker - BERt chineSE woRd toKenizER
Stars: ✭ 17 (-91.75%)
Mutual labels:  chinese-nlp, chinese-word-segmentation
Segmentit
任何 JS 环境可用的中文分词包,fork from leizongmin/node-segment
Stars: ✭ 139 (-32.52%)
Mutual labels:  chinese, chinese-nlp
Jcseg
Jcseg is a light weight NLP framework developed with Java. Provide CJK and English segmentation based on MMSEG algorithm, With also keywords extraction, key sentence extraction, summary extraction implemented based on TEXTRANK algorithm. Jcseg had a build-in http server and search modules for the latest lucene,solr,elasticsearch
Stars: ✭ 754 (+266.02%)
Mutual labels:  chinese-nlp, chinese-word-segmentation
Chinese Word Vectors
100+ Chinese Word Vectors 上百种预训练中文词向量
Stars: ✭ 9,548 (+4534.95%)
Mutual labels:  chinese, chinese-word-segmentation
Cluedatasetsearch
搜索所有中文NLP数据集,附常用英文NLP数据集
Stars: ✭ 2,112 (+925.24%)
Mutual labels:  chinese, sentiment-analysis
G2pc
g2pC: A Context-aware Grapheme-to-Phoneme Conversion module for Chinese
Stars: ✭ 155 (-24.76%)
Mutual labels:  chinese-nlp, chinese-word-segmentation
Datastories Semeval2017 Task4
Deep-learning model presented in "DataStories at SemEval-2017 Task 4: Deep LSTM with Attention for Message-level and Topic-based Sentiment Analysis".
Stars: ✭ 184 (-10.68%)
Mutual labels:  sentiment-analysis
Pyhanlp
中文分词 词性标注 命名实体识别 依存句法分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁 自然语言处理
Stars: ✭ 2,564 (+1144.66%)
Mutual labels:  chinese-word-segmentation
Jszhuyin
JS 注音:JavaScript 自動選字注音輸入法;"Smart" Chinese Zhuyin Input Method in JavaScript.
Stars: ✭ 184 (-10.68%)
Mutual labels:  chinese
Crypto trader
Q-Learning Based Cryptocurrency Trader and Portfolio Optimizer for the Poloniex Exchange
Stars: ✭ 184 (-10.68%)
Mutual labels:  sentiment-analysis

nlp4han

中文自然语言处理工具集。更多信息参见Wiki

功能特性

  • 断句
    • 基于规则的中文断句器
  • 分词
    • 基于字的最大熵中文分词器
    • 组合中文分词和词性标注器
  • 词性标注
    • 基准中文词性标注器
    • 单步基于词的最大熵中文词性标注器
    • 单步基于字的最大熵中文词性标注器
    • 组合中文分词和词性标注器
    • 基于HMM的中文词性标注器
  • N元语言模型
  • HMM模型
  • 命名实体识别
    • 基于字的命名实体识别
    • 基于分词的命名实体识别
    • 基于分词和词性标注的命名实体识别
  • 组块/浅层句法分析
    • 基于词的最大熵中文基本组块标注
    • 基于词和词性的最大熵中文基本组块标注
    • 组合中文词性标注和基本组块标注
    • 基于SVM的中文组块标注
  • 依存句法分析
    • 基于最大生成树MST和最大熵的依存句法分析
    • 基于转换的依存句法分析
  • 短语结构(成分)句法分析
    • 基于最大熵的短语结构(成分)句法分析
    • 基于CKY的PCFG短语结构(成分)句法分析
    • 中心词驱动的短语结构句法分析
    • 基于隐藏标记的非词汇化短语结构句法分析
  • 语义角色标注
    • 基于最大熵的语义角色标注
  • 指代消解
    • 基于Hobbs算法的指代消解
  • 情感分析
    • 基于朴素贝叶斯的文档情感分析
    • 基于规则和短语结构树的句子情感分析
  • GUI工具
    • 基于nlp4han功能实现的短语结构树编辑工具

更新日志

  • 2018.12.16, 基于Hobbs算法的指代消解
  • 2018.12, 基于隐藏标记的非词汇化短语结构句法分析
  • 2018.11, 集成短语结构树编辑工具到nlp4han-tools,并使用nlp4han的中文分词、词性标注和句法分析功能。
  • 2018.10, 基于SVM的中文组块标注
  • 2018.9, 中心词驱动的短语结构句法分析
  • 2018.7, 基于CKY的PCFG短语结构(成分)句法分析
  • 2018.6, 基于转换的依存句法分析
  • 2018.5, 基于朴素贝叶斯的文档情感分析, 基于规则和短语结构树的句子情感分析
  • 2018.3, 基于最大熵的语义角色标注
  • 2018.2, 基于最大熵的短语结构(成分)句法分析, HMM模型
  • 2018.1, 基于最大生成树MST和最大熵的依存句法分析
  • 2017.12, 组合中文词性标注和基本组块标注, N元语言模型
  • 2017.11, 基于词和词性的最大熵中文基本组块标注, 基于词的最大熵中文基本组块标注
  • 2017.10, 基于分词和词性标注的命名实体识别
  • 2017.9, 基于分词的命名实体识别, 基于字的命名实体识别
  • 2017.8, 基于HMM的中文词性标注器
  • 2017.7, 组合中文分词和词性标注器
  • 2017.6, 单步基于字的最大熵中文词性标注器
  • 2017.5, 单步基于词的最大熵中文词性标注器
  • 2017.4, 基准中文词性标注器
  • 2017.3, 组合中文分词和词性标注器
  • 2017.2, 基于字的最大熵中文分词器
  • 2016.12, 基于规则的中文断句器
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].