All Git Users → hankcs

20 open source projects by hankcs

1. Pyhanlp
中文分词 词性标注 命名实体识别 依存句法分析 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁 自然语言处理
2. Lda4j
A Java implemention of LDA(Latent Dirichlet Allocation)
✭ 189
java
3. Textrank
TextRank算法提取关键词的Java实现
✭ 183
java
4. Id Cnn Cws
Source codes and corpora of paper "Iterated Dilated Convolutions for Chinese Word Segmentation"
5. Neural net
反向传播神经网络及应用
✭ 77
python
6. Ahocorasickdoublearraytrie
An extremely fast implementation of Aho Corasick algorithm based on Double Array Trie.
7. Cs224n
CS224n: Natural Language Processing with Deep Learning Assignments Winter, 2017
8. Hanlp
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
9. Viterbi
An implementation of HMM-Viterbi Algorithm 通用的维特比算法实现
✭ 330
java
10. Multi Criteria Cws
Simple Solution for Multi-Criteria Chinese Word Segmentation
✭ 277
pythonnlp
11. Hanlp Lucene Plugin
HanLP中文分词Lucene插件,支持包括Solr在内的基于Lucene的系统
12. text-classification-svm
The missing SVM-based text classification module implementing HanLP's interface
13. AveragedPerceptronPython
Clone of "A Good Part-of-Speech Tagger in about 200 Lines of Python" by Matthew Honnibal
✭ 49
python
14. maxent iis
最大熵-IIS(Improved Iterative Scaling)训练算法的Java实现
✭ 18
java
15. aho-corasick
Aho-Corasick的Java实现,针对Ascii优化,支持Unicode。
✭ 168
16. MainPartExtractor
主谓宾提取器的Java实现(对斯坦福的代码失去兴趣,不再维护)
✭ 123
java
17. udacity-deep-learning
Assignments for Udacity Deep Learning class with TensorFlow in PURE Python, not IPython Notebook
✭ 67
python
18. MaxEnt
这是一个最大熵的简明Java实现,提供提供训练与预测接口。训练算法采用GIS训练算法,附带示例训练集和一个天气预测的Demo。
✭ 44
java
19. HanLPAndroidDemo
HanLP Android Demo
✭ 17
javahanlp
20. BERT-token-level-embedding
Generate BERT token level embedding without pain
✭ 25
python
1-20 of 20 user projects