Language model finetuning on NER with an easy interface, and cross-domain evaluation. We released NER models finetuned on various domain via huggingface model hub.

Stars: ✭ 54 (-67.66%)

Mutual labels: language-model

Lotclass

[EMNLP 2020] Text Classification Using Label Names Only: A Language Model Self-Training Approach

Stars: ✭ 160 (-4.19%)

Mutual labels: language-model

Nlp Library

curated collection of papers for the nlp practitioner 📖👩‍🔬

Stars: ✭ 1,025 (+513.77%)

Mutual labels: language-model

Getlang

Natural language detection package in pure Go

Stars: ✭ 110 (-34.13%)

Mutual labels: language-model

Bert language understanding

Pre-training of Deep Bidirectional Transformers for Language Understanding: pre-train TextCNN

Stars: ✭ 933 (+458.68%)

Mutual labels: language-model

Awesome Speech Recognition Speech Synthesis Papers

Automatic Speech Recognition (ASR), Speaker Verification, Speech Synthesis, Text-to-Speech (TTS), Language Modelling, Singing Voice Synthesis (SVS), Voice Conversion (VC)

Stars: ✭ 2,085 (+1148.5%)

Mutual labels: language-model

Lm Lstm Crf

Empower Sequence Labeling with Task-Aware Language Model

Stars: ✭ 778 (+365.87%)

Mutual labels: language-model

Pytorch gbw lm

PyTorch Language Model for 1-Billion Word (LM1B / GBW) Dataset

Stars: ✭ 101 (-39.52%)

Mutual labels: language-model

Text Gan Tensorflow

TensorFlow GAN implementation using Gumbel Softmax

Stars: ✭ 87 (-47.9%)

Mutual labels: language-model

Nlp chinese corpus

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP

Stars: ✭ 6,656 (+3885.63%)

Mutual labels: language-model

Clue

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

Stars: ✭ 2,425 (+1352.1%)

Mutual labels: language-model

Pytorch Openai Transformer Lm

🐥A PyTorch implementation of OpenAI's finetuned transformer language model with a script to import the weights pre-trained by OpenAI

Stars: ✭ 1,268 (+659.28%)

Mutual labels: language-model

Transformer Lm

Transformer language model (GPT-2) with sentencepiece tokenizer

Stars: ✭ 154 (-7.78%)

Mutual labels: language-model

Greek Bert

A Greek edition of BERT pre-trained language model

Stars: ✭ 84 (-49.7%)

Mutual labels: language-model

Chars2vec

Character-based word embeddings model based on RNN for handling real world texts

Stars: ✭ 130 (-22.16%)

Mutual labels: language-model

Nezha chinese pytorch

NEZHA: Neural Contextualized Representation for Chinese Language Understanding

Stars: ✭ 65 (-61.08%)

Mutual labels: language-model

Lazynlp

Library to scrape and clean web pages to create massive datasets.

Stars: ✭ 1,985 (+1088.62%)

Mutual labels: language-model

Indonesian Language Models

Indonesian Language Models and its Usage

Stars: ✭ 64 (-61.68%)

Mutual labels: language-model

Dynamic Memory Networks Plus Pytorch

Implementation of Dynamic memory networks plus in Pytorch

Stars: ✭ 123 (-26.35%)

Mutual labels: language-model

Char rnn lm zh

language model in Chinese，基于Pytorch官方文档实现

Stars: ✭ 57 (-65.87%)

Mutual labels: language-model

Electra pytorch

Pretrain and finetune ELECTRA with fastai and huggingface. (Results of the paper replicated !)

Stars: ✭ 149 (-10.78%)

Mutual labels: language-model

Vietnamese Electra

Electra pre-trained model using Vietnamese corpus

Stars: ✭ 55 (-67.07%)

Mutual labels: language-model

Haystack

🔍 Haystack is an open source NLP framework that leverages Transformer models. It enables developers to implement production-ready neural search, question answering, semantic document search and summarization for a wide range of applications.

Stars: ✭ 3,409 (+1941.32%)

Mutual labels: language-model

Suggest

Top-k Approximate String Matching.

Stars: ✭ 50 (-70.06%)

Mutual labels: language-model

Indic Bert

BERT-based Multilingual Model for Indian Languages

Stars: ✭ 160 (-4.19%)

Mutual labels: language-model

Gpt2 French

GPT-2 French demo | Démo française de GPT-2

Stars: ✭ 47 (-71.86%)

Mutual labels: language-model

Keras Gpt 2

Load GPT-2 checkpoint and generate texts

Stars: ✭ 113 (-32.34%)

Mutual labels: language-model

Pytorch Cpp

C++ Implementation of PyTorch Tutorials for Everyone

Stars: ✭ 1,014 (+507.19%)

Mutual labels: language-model

Awd Lstm Lm

LSTM and QRNN Language Model Toolkit for PyTorch

Stars: ✭ 1,834 (+998.2%)

Mutual labels: language-model

Spago

Self-contained Machine Learning and Natural Language Processing library in Go

Stars: ✭ 854 (+411.38%)

Mutual labels: language-model

Transformers

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

Stars: ✭ 55,742 (+33278.44%)

Mutual labels: language-model

Spacy Transformers

🛸 Use pretrained transformers like BERT, XLNet and GPT-2 in spaCy

Stars: ✭ 919 (+450.3%)

Mutual labels: language-model

Keras Xlnet

Implementation of XLNet that can load pretrained checkpoints

Stars: ✭ 159 (-4.79%)

Mutual labels: language-model

Chinese Electra

Pre-trained Chinese ELECTRA（中文ELECTRA预训练模型）

Stars: ✭ 830 (+397.01%)

Mutual labels: language-model

Openseq2seq

Toolkit for efficient experimentation with Speech Recognition, Text2Speech and NLP

Stars: ✭ 1,378 (+725.15%)

Mutual labels: language-model

Pykaldi

A Python wrapper for Kaldi

Stars: ✭ 756 (+352.69%)

Mutual labels: language-model

Ld Net

Efficient Contextualized Representation: Language Model Pruning for Sequence Labeling

Stars: ✭ 148 (-11.38%)

Mutual labels: language-model

Pyclue

Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark

Stars: ✭ 91 (-45.51%)

Mutual labels: language-model

Gpt Neo

An implementation of model parallel GPT2& GPT3-like models, with the ability to scale up to full GPT3 sizes (and possibly more!), using the mesh-tensorflow library.

Stars: ✭ 1,252 (+649.7%)

Mutual labels: language-model

Xlnet Gen

XLNet for generating language.

Stars: ✭ 164 (-1.8%)

Mutual labels: language-model

F Lm

Language Modeling

Stars: ✭ 156 (-6.59%)

Mutual labels: language-model

Tupe

Transformer with Untied Positional Encoding (TUPE). Code of paper "Rethinking Positional Encoding in Language Pre-training". Improve existing models like BERT.

Stars: ✭ 143 (-14.37%)

Mutual labels: language-model

Tongrams

A C++ library providing fast language model queries in compressed space.

Stars: ✭ 88 (-47.31%)

Mutual labels: language-model

1-60 of 152 similar projects

›