Repository for the experiments described in the paper named "DeepSentiPers: Novel Deep Learning Models Trained Over Proposed Augmented Persian Sentiment Corpus"

Stars: ✭ 17 (-82.29%)

Mutual labels: corpus

Chatterbot Corpus

A multilingual dialog corpus

Stars: ✭ 964 (+904.17%)

Mutual labels: corpus

SpiCE-Corpus

An open-access corpus of conversational bilingual speech in Cantonese and English

Stars: ✭ 33 (-65.62%)

Mutual labels: corpus

Awesome Persian Nlp Ir

Curated List of Persian Natural Language Processing and Information Retrieval Tools and Resources

Stars: ✭ 460 (+379.17%)

Mutual labels: corpus

folia

FoLiA: Format for Linguistic Annotation - FoLiA is a rich XML-based annotation format for the representation of language resources (including corpora) with linguistic annotations. A wide variety of linguistic annotations are supported, making FoLiA a useful format for NLP tasks and data interchange. Note that the actual Python library for proces…

Stars: ✭ 56 (-41.67%)

Mutual labels: corpus

Russian news corpus

Russian mass media stemmed texts corpus / Корпус лемматизированных (морфологически нормализованных) текстов российских СМИ

Stars: ✭ 76 (-20.83%)

Mutual labels: corpus

KWDLC

Kyoto University Web Document Leads Corpus

Stars: ✭ 64 (-33.33%)

Mutual labels: corpus

Wordless

An Integrated Corpus Tool With Multilingual Support for the Study of Language, Literature, and Translation

Stars: ✭ 378 (+293.75%)

Mutual labels: corpus

pdf-corpus

Python script to quickly create hand-crafted PDF files

Stars: ✭ 17 (-82.29%)

Mutual labels: corpus

Naive Bayes Classifier

Naive Bayes classifier is classification algorithm. It uses Naive based Bernoulli and Multinomial equation to classify documents(Text) as ham or spam.

Stars: ✭ 6 (-93.75%)

Mutual labels: corpus

TV4Dialog

No description or website provided.

Stars: ✭ 33 (-65.62%)

Mutual labels: corpus

Fakenewscorpus

A dataset of millions of news articles scraped from a curated list of data sources.

Stars: ✭ 255 (+165.63%)

Mutual labels: corpus

EdgarAllanPoetry

Computer-generated poetry

Stars: ✭ 22 (-77.08%)

Mutual labels: corpus

kanji-frequency

Kanji usage frequency data collected from various sources

Stars: ✭ 92 (-4.17%)

Mutual labels: corpus

Nlp chinese corpus

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP

Stars: ✭ 6,656 (+6833.33%)

Mutual labels: corpus

fastmorph

Fast corpus search engine originally made for the Corpus of Written Tatar language

Stars: ✭ 14 (-85.42%)

Mutual labels: corpus

Mitie chinese wikipedia corpus

Pre-trained Wikipedia corpus by MITIE

Stars: ✭ 43 (-55.21%)

Mutual labels: corpus

Species-Names-Corpus

物种名称语料库。植物名,动物名。

Stars: ✭ 23 (-76.04%)

Mutual labels: corpus

Cluepretrainedmodels

高质量中文预训练模型集合：最先进大模型、最快小模型、相似度专门模型

Stars: ✭ 493 (+413.54%)

Mutual labels: corpus

dialogue-datasets

collect the open dialog corpus and some useful data processing utils.

Stars: ✭ 24 (-75%)

Mutual labels: corpus

Ja.text8

Japanese text8 corpus for word embedding.

Stars: ✭ 79 (-17.71%)

Mutual labels: corpus

fuzzing-corpus

My fuzzing corpus

Stars: ✭ 120 (+25%)

Mutual labels: corpus

Small Chinese Corpus

Some useful Chinese corpus datasets 中文语料小数据

Stars: ✭ 462 (+381.25%)

Mutual labels: corpus

OpenDialog

An Open-Source Package for Chinese Open-domain Conversational Chatbot (中文闲聊对话系统，一键部署微信闲聊机器人)

Stars: ✭ 94 (-2.08%)

Mutual labels: corpus

Typing Assistant

Typing Assistant provides the ability to autocomplete words and suggests predictions for the next word. This makes typing faster, more intelligent and reduces effort.

Stars: ✭ 32 (-66.67%)

Mutual labels: corpus

PubMed-PICO-Detection

PubMed PICO Element Detection Dataset

Stars: ✭ 37 (-61.46%)

Mutual labels: corpus

Bookcorpus

Crawl BookCorpus

Stars: ✭ 443 (+361.46%)

Mutual labels: corpus

thai-language

computer tools for thai language