1. Pycorrectorpycorrector is a toolkit for text error correction. 文本纠错,Kenlm,Seq2Seq_Attention,BERT,MacBERT,ELECTRA,ERNIE,Transformer等模型实现,开箱即用。
2. Text2vectext2vec, chinese text to vetor.(文本向量化表示工具,包括词向量化、句子向量化、句子相似度计算)
3. Text Classifiertext-classifier is a toolkit for text classification. It was developed to facilitate the designing, comparing, and sharing of text classification models.
4. Parrots Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine for Chinese.
5. Judger自动作文评分工具,支持中文、英文作文智能评分,支持评分模型自训练,支持WEKA处理模型数据,支持自定义评分算法。java开发。
6. Similaritysimilarity:相似度计算工具包,java编写。用于词语、短语、句子、词法分析、情感分析、语义分析等相关的相似度计算。
7. Python Tutorialpython教程,包括:python基础、python进阶;常用机器学习库:numpy、scipy、sklearn、xgboost;深度学习库:keras、tensorflow、paddle、pytorch。
9. pysentiChinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。
10. crf-segcrf-seg:用于生产环境的中文分词处理工具,可自定义语料、可自定义模型、架构清晰,分词效果好。java编写。
11. dialogbotdialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器人,基于问答型对话、任务型对话、聊天型对话等模型实现,支持网络检索问答,领域知识问答,任务引导问答,闲聊问答,开箱即用。