PyThaiNLP / Lexicon Thai
คลังศัพท์ภาษาไทย
Programming Languages
python 139335 projects - #7 most used programming language
Projects that are alternatives of or similar to Lexicon Thai
Lyrics CorporaAn unofficial Python API that allows users to create a corpus of lyrical text from their favorite artists and billboard charts
Stars: ✭ 13 (-86.46%)
Mutual labels: corpus
Russian news corpusRussian mass media stemmed texts corpus / Корпус лемматизированных (морфологически нормализованных) текстов российских СМИ
Stars: ✭ 76 (-20.83%)
Mutual labels: corpus
QuantedaAn R package for the Quantitative Analysis of Textual Data
Stars: ✭ 647 (+573.96%)
Mutual labels: corpus
Naive Bayes ClassifierNaive Bayes classifier is classification algorithm. It uses Naive based Bernoulli and Multinomial equation to classify documents(Text) as ham or spam.
Stars: ✭ 6 (-93.75%)
Mutual labels: corpus
Chatterbot CorpusA multilingual dialog corpus
Stars: ✭ 964 (+904.17%)
Mutual labels: corpus
Awesome Persian Nlp IrCurated List of Persian Natural Language Processing and Information Retrieval Tools and Resources
Stars: ✭ 460 (+379.17%)
Mutual labels: corpus
PycluePython toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark
Stars: ✭ 91 (-5.21%)
Mutual labels: corpus
Company Names Corpus公司名语料库。机构名语料库。公司简称,缩写,品牌词,企业名。可用于中文分词、机构名实体识别。
Stars: ✭ 868 (+804.17%)
Mutual labels: corpus
BlacklabA corpus retrieval engine based on Apache Lucene
Stars: ✭ 69 (-28.12%)
Mutual labels: corpus
Nlp chinese corpus大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
Stars: ✭ 6,656 (+6833.33%)
Mutual labels: corpus
Ja.text8Japanese text8 corpus for word embedding.
Stars: ✭ 79 (-17.71%)
Mutual labels: corpus
Small Chinese CorpusSome useful Chinese corpus datasets 中文语料小数据
Stars: ✭ 462 (+381.25%)
Mutual labels: corpus
Typing AssistantTyping Assistant provides the ability to autocomplete words and suggests predictions for the next word. This makes typing faster, more intelligent and reduces effort.
Stars: ✭ 32 (-66.67%)
Mutual labels: corpus
Chi Corpus迟先生语料库
Stars: ✭ 96 (+0%)
Mutual labels: corpus
Dataset Listlists of text corpus and more (mainly Japanese)
Stars: ✭ 84 (-12.5%)
Mutual labels: corpus
CoarijCorpus of Annual Reports in Japan
Stars: ✭ 55 (-42.71%)
Mutual labels: corpus
lexicon-thai
คลังศัพท์ภาษาไทย
lexicon-thai เป็นฐานข้อมูลภาษาไทย
วันเริ่มต้นโครงการ : 14 มกราคม 2560
เริ่มต้นพัฒนาโดย นาย วรรณพงษ์ ภัททิยไพบูลย์
วัตถุประสงค์
เพื่ออำนวยความสะดวกให้กับผู้ที่สนใจทำการประมวลผลภาษาธรรมชาติ (NLP) ในภาษาไทย โดยฐานข้อมูลนี้ยังถูกใช้งานใน PyThaiNLP และโครงการอื่น ๆ เนื่องจากฐานข้อมูลภาษาไทยที่คอมพิวเตอร์อ่านได้โดยง่ายเป็นทรัพยากรที่ขาดแคลนอย่างมากในปัจจุบัน หน่วยงานภาครัฐไม่ยอมปล่อยฐานข้อมูลที่มีทั้งหมดออกมา ด้วยเหตุนี้ผมลงมือทำฐานข้อมูลภาษาไทยขึ้นมาเอง และเปิดเผยฐานข้อมูล รวมถึงกระบวนการสร้างฐานข้อมูล โดยดูได้จาก Git ที่บันทึกการเปลี่ยนแปลง - วรรณพงษ์ ภัททิยไพพบูลย์ (28 มกราคม 2560)
ร่วมพัฒนา
fork แล้ว ส่ง pull request กลับมายัง lexicon-thai
สัญญาอนุญาต
ฐานข้อมูลทั้งหมดในนี้ใช้สัญญาอนุญาตครีเอทีฟคอมมอนส์แบบแสดงที่มา-อนุญาตแบบเดียวกัน 4.0
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
และขึ้นอยู่กับสัญญาอนุญาตของแต่ละชุดข้อมูลที่แจกจ่าย
คุณสามารถตรวจสอบความเปลี่ยนแปลงทั้งหมดโปรเจคนี้ได้จาก Git ที่บันทึกไว้
Note that the project description data, including the texts, logos, images, and/or trademarks,
for each open source project belongs to its rightful owner.
If you wish to add or remove any projects, please contact us at
[email protected].