An implementation of model parallel GPT-3-like models on GPUs, based on the DeepSpeed library. Designed to be able to train models in the hundreds of billions of parameters or larger.

Stars: ✭ 303 (+46.38%)

Mutual labels: language-model

Bit Rnn

Quantize weights and activations in Recurrent Neural Networks.

Stars: ✭ 86 (-58.45%)

Mutual labels: language-model

Transfer Nlp

NLP library designed for reproducible experimentation management

Stars: ✭ 287 (+38.65%)

Mutual labels: language-model

Attention Mechanisms

Implementations for a family of attention mechanisms, suitable for all kinds of natural language processing tasks and compatible with TensorFlow 2.0 and Keras.

Stars: ✭ 203 (-1.93%)

Mutual labels: language-model

Bluebert

BlueBERT, pre-trained on PubMed abstracts and clinical notes (MIMIC-III).

Stars: ✭ 273 (+31.88%)

Mutual labels: language-model

Bio embeddings

Get protein embeddings from protein sequences

Stars: ✭ 86 (-58.45%)

Mutual labels: language-model

few-shot-lm

The source code of "Language Models are Few-shot Multilingual Learners" (MRL @ EMNLP 2021)

Stars: ✭ 32 (-84.54%)

Mutual labels: language-model

Awesome Sentence Embedding

A curated list of pretrained sentence and word embedding models

Stars: ✭ 1,973 (+853.14%)

Mutual labels: language-model

python-arpa

🐍 Python library for n-gram models in ARPA format

Stars: ✭ 35 (-83.09%)

Mutual labels: language-model

Full stack transformer

Pytorch library for end-to-end transformer models training, inference and serving

Stars: ✭ 71 (-65.7%)

Mutual labels: language-model

SDLM-pytorch

Code accompanying EMNLP 2018 paper Language Modeling with Sparse Product of Sememe Experts

Stars: ✭ 27 (-86.96%)

Mutual labels: language-model

Optimus

Optimus: the first large-scale pre-trained VAE language model

Stars: ✭ 180 (-13.04%)

Mutual labels: language-model

tensorflow-with-kenlm

Tensorflow with KenLM integrated for beam search scoring

Stars: ✭ 30 (-85.51%)

Mutual labels: language-model

Cross Domain ner

Cross-domain NER using cross-domain language modeling, code for ACL 2019 paper

Stars: ✭ 67 (-67.63%)

Mutual labels: language-model

MinTL

MinTL: Minimalist Transfer Learning for Task-Oriented Dialogue Systems

Stars: ✭ 61 (-70.53%)

Mutual labels: language-model

Awesome Speech Recognition Speech Synthesis Papers

Automatic Speech Recognition (ASR), Speaker Verification, Speech Synthesis, Text-to-Speech (TTS), Language Modelling, Singing Voice Synthesis (SVS), Voice Conversion (VC)

Stars: ✭ 2,085 (+907.25%)

Mutual labels: language-model

CodeT5

Code for CodeT5: a new code-aware pre-trained encoder-decoder model.

Stars: ✭ 390 (+88.41%)

Mutual labels: language-model

Gpt2

PyTorch Implementation of OpenAI GPT-2

Stars: ✭ 64 (-69.08%)

Mutual labels: language-model

Word-Prediction-Ngram

Next Word Prediction using n-gram Probabilistic Model with various Smoothing Techniques

Stars: ✭ 25 (-87.92%)

Mutual labels: language-model

Char Rnn Chinese

Multi-layer Recurrent Neural Networks (LSTM, GRU, RNN) for character-level language models in Torch. Based on code of https://github.com/karpathy/char-rnn. Support Chinese and other things.

Stars: ✭ 192 (-7.25%)

Mutual labels: language-model

language-planner

Official Code for "Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents"

Stars: ✭ 84 (-59.42%)

Mutual labels: language-model

Phonlp

PhoNLP: A BERT-based multi-task learning toolkit for part-of-speech tagging, named entity recognition and dependency parsing (NAACL 2021)

Stars: ✭ 56 (-72.95%)

Mutual labels: language-model

bert-movie-reviews-sentiment-classifier

Build a Movie Reviews Sentiment Classifier with Google's BERT Language Model

Stars: ✭ 12 (-94.2%)

Mutual labels: language-model

Tupe

Transformer with Untied Positional Encoding (TUPE). Code of paper "Rethinking Positional Encoding in Language Pre-training". Improve existing models like BERT.

Stars: ✭ 143 (-30.92%)

Mutual labels: language-model

Deep-NLP-Resources

Curated list of all NLP Resources

Stars: ✭ 65 (-68.6%)

Mutual labels: language-model

Tner

Language model finetuning on NER with an easy interface, and cross-domain evaluation. We released NER models finetuned on various domain via huggingface model hub.

Stars: ✭ 54 (-73.91%)

Mutual labels: language-model

mongolian-nlp

Useful resources for Mongolian NLP

Stars: ✭ 119 (-42.51%)

Mutual labels: language-model

Gpt Neo

An implementation of model parallel GPT2& GPT3-like models, with the ability to scale up to full GPT3 sizes (and possibly more!), using the mesh-tensorflow library.

Stars: ✭ 1,252 (+504.83%)

Mutual labels: language-model

Lmchallenge

A library & tools to evaluate predictive language models.

Stars: ✭ 47 (-77.29%)

Mutual labels: language-model

Pytorch Nce

The Noise Contrastive Estimation for softmax output written in Pytorch

Stars: ✭ 204 (-1.45%)

Mutual labels: language-model

Lingvo

Stars: ✭ 2,361 (+1040.58%)