Transformer with Untied Positional Encoding (TUPE). Code of paper "Rethinking Positional Encoding in Language Pre-training". Improve existing models like BERT.

Stars: ✭ 143 (-29.9%)

Mutual labels: language-model

Robbert

A Dutch RoBERTa-based language model

Stars: ✭ 120 (-41.18%)

Mutual labels: language-model

Lmchallenge

A library & tools to evaluate predictive language models.

Stars: ✭ 47 (-76.96%)

Mutual labels: language-model

Lotclass

[EMNLP 2020] Text Classification Using Label Names Only: A Language Model Self-Training Approach

Stars: ✭ 160 (-21.57%)

Mutual labels: language-model

Getlang

Natural language detection package in pure Go

Stars: ✭ 110 (-46.08%)

Mutual labels: language-model

Bert Sklearn

a sklearn wrapper for Google's BERT model

Stars: ✭ 182 (-10.78%)

Mutual labels: language-model

Pytorch gbw lm

PyTorch Language Model for 1-Billion Word (LM1B / GBW) Dataset

Stars: ✭ 101 (-50.49%)

Mutual labels: language-model

Speecht

An opensource speech-to-text software written in tensorflow

Stars: ✭ 152 (-25.49%)

Mutual labels: language-model

Bit Rnn

Quantize weights and activations in Recurrent Neural Networks.

Stars: ✭ 86 (-57.84%)

Mutual labels: language-model

Char Rnn Chinese

Multi-layer Recurrent Neural Networks (LSTM, GRU, RNN) for character-level language models in Torch. Based on code of https://github.com/karpathy/char-rnn. Support Chinese and other things.

Stars: ✭ 192 (-5.88%)

Mutual labels: language-model

Full stack transformer

Pytorch library for end-to-end transformer models training, inference and serving

Stars: ✭ 71 (-65.2%)

Mutual labels: language-model

Awesome Speech Recognition Speech Synthesis Papers

Automatic Speech Recognition (ASR), Speaker Verification, Speech Synthesis, Text-to-Speech (TTS), Language Modelling, Singing Voice Synthesis (SVS), Voice Conversion (VC)

Stars: ✭ 2,085 (+922.06%)

Mutual labels: language-model

Gpt2

PyTorch Implementation of OpenAI GPT-2

Stars: ✭ 64 (-68.63%)

Mutual labels: language-model

Gpt Neo

An implementation of model parallel GPT2& GPT3-like models, with the ability to scale up to full GPT3 sizes (and possibly more!), using the mesh-tensorflow library.

Stars: ✭ 1,252 (+513.73%)

Mutual labels: language-model

Tner

Language model finetuning on NER with an easy interface, and cross-domain evaluation. We released NER models finetuned on various domain via huggingface model hub.

Stars: ✭ 54 (-73.53%)

Mutual labels: language-model

Electra

中文预训练 ELECTRA 模型: 基于对抗学习 pretrain Chinese Model

Stars: ✭ 132 (-35.29%)

Mutual labels: language-model

Dynamic Memory Networks Plus Pytorch

Implementation of Dynamic memory networks plus in Pytorch

Stars: ✭ 123 (-39.71%)

Mutual labels: language-model

Gpt2 French

GPT-2 French demo | Démo française de GPT-2

Stars: ✭ 47 (-76.96%)

Mutual labels: language-model

Lazynlp

Library to scrape and clean web pages to create massive datasets.

Stars: ✭ 1,985 (+873.04%)

Mutual labels: language-model

Haystack

🔍 Haystack is an open source NLP framework that leverages Transformer models. It enables developers to implement production-ready neural search, question answering, semantic document search and summarization for a wide range of applications.

Stars: ✭ 3,409 (+1571.08%)

Mutual labels: language-model

Bert As Language Model

bert as language model, fork from https://github.com/google-research/bert

Stars: ✭ 185 (-9.31%)

Mutual labels: language-model

Keras Gpt 2

Load GPT-2 checkpoint and generate texts

Stars: ✭ 113 (-44.61%)

Mutual labels: language-model

Keras Xlnet

Implementation of XLNet that can load pretrained checkpoints

Stars: ✭ 159 (-22.06%)

Mutual labels: language-model

Transformers

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

Stars: ✭ 55,742 (+27224.51%)

Mutual labels: language-model

Gpt Scrolls

A collaborative collection of open-source safe GPT-3 prompts that work well

Stars: ✭ 195 (-4.41%)

Mutual labels: language-model

Openseq2seq

Toolkit for efficient experimentation with Speech Recognition, Text2Speech and NLP

Stars: ✭ 1,378 (+575.49%)

Mutual labels: language-model

Transformer Lm

Transformer language model (GPT-2) with sentencepiece tokenizer

Stars: ✭ 154 (-24.51%)

Mutual labels: language-model

Pyclue

Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark

Stars: ✭ 91 (-55.39%)

Mutual labels: language-model

Keras Bert

Implementation of BERT that could load official pre-trained models for feature extraction and prediction

Stars: ✭ 2,264 (+1009.8%)

Mutual labels: language-model

Text Gan Tensorflow

TensorFlow GAN implementation using Gumbel Softmax

Stars: ✭ 87 (-57.35%)

Mutual labels: language-model

Electra pytorch

Pretrain and finetune ELECTRA with fastai and huggingface. (Results of the paper replicated !)

Stars: ✭ 149 (-26.96%)

Mutual labels: language-model

Pytorch Openai Transformer Lm

🐥A PyTorch implementation of OpenAI's finetuned transformer language model with a script to import the weights pre-trained by OpenAI

Stars: ✭ 1,268 (+521.57%)

Mutual labels: language-model

Lingvo

Stars: ✭ 2,361 (+1057.35%)

Mutual labels: language-model

Greek Bert

A Greek edition of BERT pre-trained language model

Stars: ✭ 84 (-58.82%)

Mutual labels: language-model

Awd Lstm Lm

LSTM and QRNN Language Model Toolkit for PyTorch

Stars: ✭ 1,834 (+799.02%)

Mutual labels: language-model

Nezha chinese pytorch

NEZHA: Neural Contextualized Representation for Chinese Language Understanding

Stars: ✭ 65 (-68.14%)

Mutual labels: language-model

Macbert

Revisiting Pre-trained Models for Chinese Natural Language Processing (Findings of EMNLP)

Stars: ✭ 167 (-18.14%)

Mutual labels: language-model

Indonesian Language Models

Indonesian Language Models and its Usage

Stars: ✭ 64 (-68.63%)

Mutual labels: language-model

Ld Net

Efficient Contextualized Representation: Language Model Pruning for Sequence Labeling

Stars: ✭ 148 (-27.45%)

Mutual labels: language-model

Char rnn lm zh

language model in Chinese，基于Pytorch官方文档实现

Stars: ✭ 57 (-72.06%)

Mutual labels: language-model

Automatic Speech Recognition

🎧 Automatic Speech Recognition: DeepSpeech & Seq2Seq (TensorFlow)

Stars: ✭ 192 (-5.88%)

Mutual labels: language-model

Vietnamese Electra

Electra pre-trained model using Vietnamese corpus

Stars: ✭ 55 (-73.04%)

Mutual labels: language-model

Clue

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

Stars: ✭ 2,425 (+1088.73%)

Mutual labels: language-model

Suggest

Top-k Approximate String Matching.

Stars: ✭ 50 (-75.49%)

Mutual labels: language-model

Indic Bert

BERT-based Multilingual Model for Indian Languages

Stars: ✭ 160 (-21.57%)

Mutual labels: language-model

Chars2vec

Character-based word embeddings model based on RNN for handling real world texts

Stars: ✭ 130 (-36.27%)

Mutual labels: language-model

Attention Mechanisms

Implementations for a family of attention mechanisms, suitable for all kinds of natural language processing tasks and compatible with TensorFlow 2.0 and Keras.

Stars: ✭ 203 (-0.49%)

Mutual labels: language-model

Protein Sequence Embedding Iclr2019

Source code for "Learning protein sequence embeddings using information from structure" - ICLR 2019

Stars: ✭ 194 (-4.9%)

Mutual labels: language-model

Nlp learning

结合python一起学习自然语言处理 (nlp): 语言模型、HMM、PCFG、Word2vec、完形填空式阅读理解任务、朴素贝叶斯分类器、TFIDF、PCA、SVD

Stars: ✭ 188 (-7.84%)

Mutual labels: language-model

Xlnet Gen

XLNet for generating language.