All Projects → PyThaiNLP → Lexicon Thai

PyThaiNLP / Lexicon Thai

คลังศัพท์ภาษาไทย

Programming Languages

python
139335 projects - #7 most used programming language

Labels

Projects that are alternatives of or similar to Lexicon Thai

Weixin public corpus
微信公众号语料库
Stars: ✭ 465 (+384.38%)
Mutual labels:  corpus
Lyrics Corpora
An unofficial Python API that allows users to create a corpus of lyrical text from their favorite artists and billboard charts
Stars: ✭ 13 (-86.46%)
Mutual labels:  corpus
Russian news corpus
Russian mass media stemmed texts corpus / Корпус лемматизированных (морфологически нормализованных) текстов российских СМИ
Stars: ✭ 76 (-20.83%)
Mutual labels:  corpus
Quanteda
An R package for the Quantitative Analysis of Textual Data
Stars: ✭ 647 (+573.96%)
Mutual labels:  corpus
Naive Bayes Classifier
Naive Bayes classifier is classification algorithm. It uses Naive based Bernoulli and Multinomial equation to classify documents(Text) as ham or spam.
Stars: ✭ 6 (-93.75%)
Mutual labels:  corpus
Chatterbot Corpus
A multilingual dialog corpus
Stars: ✭ 964 (+904.17%)
Mutual labels:  corpus
Awesome Persian Nlp Ir
Curated List of Persian Natural Language Processing and Information Retrieval Tools and Resources
Stars: ✭ 460 (+379.17%)
Mutual labels:  corpus
Pyclue
Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark
Stars: ✭ 91 (-5.21%)
Mutual labels:  corpus
Company Names Corpus
公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。
Stars: ✭ 868 (+804.17%)
Mutual labels:  corpus
Blacklab
A corpus retrieval engine based on Apache Lucene
Stars: ✭ 69 (-28.12%)
Mutual labels:  corpus
Nlp chinese corpus
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
Stars: ✭ 6,656 (+6833.33%)
Mutual labels:  corpus
Insuranceqa Corpus Zh
🚁 保险行业语料库,聊天机器人
Stars: ✭ 821 (+755.21%)
Mutual labels:  corpus
Mitie chinese wikipedia corpus
Pre-trained Wikipedia corpus by MITIE
Stars: ✭ 43 (-55.21%)
Mutual labels:  corpus
Cluepretrainedmodels
高质量中文预训练模型集合:最先进大模型、最快小模型、相似度专门模型
Stars: ✭ 493 (+413.54%)
Mutual labels:  corpus
Ja.text8
Japanese text8 corpus for word embedding.
Stars: ✭ 79 (-17.71%)
Mutual labels:  corpus
Small Chinese Corpus
Some useful Chinese corpus datasets 中文语料小数据
Stars: ✭ 462 (+381.25%)
Mutual labels:  corpus
Typing Assistant
Typing Assistant provides the ability to autocomplete words and suggests predictions for the next word. This makes typing faster, more intelligent and reduces effort.
Stars: ✭ 32 (-66.67%)
Mutual labels:  corpus
Chi Corpus
迟先生语料库
Stars: ✭ 96 (+0%)
Mutual labels:  corpus
Dataset List
lists of text corpus and more (mainly Japanese)
Stars: ✭ 84 (-12.5%)
Mutual labels:  corpus
Coarij
Corpus of Annual Reports in Japan
Stars: ✭ 55 (-42.71%)
Mutual labels:  corpus

lexicon-thai

คลังศัพท์ภาษาไทย

lexicon-thai เป็นฐานข้อมูลภาษาไทย

วันเริ่มต้นโครงการ : 14 มกราคม 2560

เริ่มต้นพัฒนาโดย นาย วรรณพงษ์ ภัททิยไพบูลย์

วัตถุประสงค์

เพื่ออำนวยความสะดวกให้กับผู้ที่สนใจทำการประมวลผลภาษาธรรมชาติ (NLP) ในภาษาไทย โดยฐานข้อมูลนี้ยังถูกใช้งานใน PyThaiNLP และโครงการอื่น ๆ เนื่องจากฐานข้อมูลภาษาไทยที่คอมพิวเตอร์อ่านได้โดยง่ายเป็นทรัพยากรที่ขาดแคลนอย่างมากในปัจจุบัน หน่วยงานภาครัฐไม่ยอมปล่อยฐานข้อมูลที่มีทั้งหมดออกมา ด้วยเหตุนี้ผมลงมือทำฐานข้อมูลภาษาไทยขึ้นมาเอง และเปิดเผยฐานข้อมูล รวมถึงกระบวนการสร้างฐานข้อมูล โดยดูได้จาก Git ที่บันทึกการเปลี่ยนแปลง - วรรณพงษ์ ภัททิยไพพบูลย์ (28 มกราคม 2560)

ร่วมพัฒนา

fork แล้ว ส่ง pull request กลับมายัง lexicon-thai

สัญญาอนุญาต

Creative Commons License

ฐานข้อมูลทั้งหมดในนี้ใช้สัญญาอนุญาตครีเอทีฟคอมมอนส์แบบแสดงที่มา-อนุญาตแบบเดียวกัน 4.0

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

และขึ้นอยู่กับสัญญาอนุญาตของแต่ละชุดข้อมูลที่แจกจ่าย

คุณสามารถตรวจสอบความเปลี่ยนแปลงทั้งหมดโปรเจคนี้ได้จาก Git ที่บันทึกไว้

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].