🔍 Haystack is an open source NLP framework that leverages Transformer models. It enables developers to implement production-ready neural search, question answering, semantic document search and summarization for a wide range of applications.

Stars: ✭ 3,409 (+50.57%)

Mutual labels: language-model, bert

Awd Lstm Lm

LSTM and QRNN Language Model Toolkit for PyTorch

Stars: ✭ 1,834 (-18.99%)

Mutual labels: language-model

Keras Gpt 2

Load GPT-2 checkpoint and generate texts

Stars: ✭ 113 (-95.01%)

Mutual labels: language-model

Getlang

Natural language detection package in pure Go

Stars: ✭ 110 (-95.14%)

Mutual labels: language-model

Easy Bert

A Dead Simple BERT API for Python and Java (https://github.com/google-research/bert)

Stars: ✭ 106 (-95.32%)

Mutual labels: language-model

Lazynlp

Library to scrape and clean web pages to create massive datasets.

Stars: ✭ 1,985 (-12.32%)

Mutual labels: language-model

Ld Net

Efficient Contextualized Representation: Language Model Pruning for Sequence Labeling

Stars: ✭ 148 (-93.46%)

Mutual labels: language-model

Pytorch gbw lm

PyTorch Language Model for 1-Billion Word (LM1B / GBW) Dataset

Stars: ✭ 101 (-95.54%)

Mutual labels: language-model

Pyclue

Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark

Stars: ✭ 91 (-95.98%)

Mutual labels: language-model

Tongrams

A C++ library providing fast language model queries in compressed space.

Stars: ✭ 88 (-96.11%)

Mutual labels: language-model

Text Gan Tensorflow

TensorFlow GAN implementation using Gumbel Softmax

Stars: ✭ 87 (-96.16%)

Mutual labels: language-model

Pytorch Openai Transformer Lm

🐥A PyTorch implementation of OpenAI's finetuned transformer language model with a script to import the weights pre-trained by OpenAI

Stars: ✭ 1,268 (-43.99%)

Mutual labels: language-model

Macbert

Revisiting Pre-trained Models for Chinese Natural Language Processing (Findings of EMNLP)

Stars: ✭ 167 (-92.62%)

Mutual labels: language-model

Keras Xlnet

Implementation of XLNet that can load pretrained checkpoints

Stars: ✭ 159 (-92.98%)

Mutual labels: language-model

Electra

中文预训练 ELECTRA 模型: 基于对抗学习 pretrain Chinese Model

Stars: ✭ 132 (-94.17%)

Mutual labels: language-model

Greek Bert

A Greek edition of BERT pre-trained language model

Stars: ✭ 84 (-96.29%)

Mutual labels: language-model

Lingo

package lingo provides the data structures and algorithms required for natural language processing

Stars: ✭ 113 (-95.01%)

Mutual labels: language-model

Full stack transformer

Pytorch library for end-to-end transformer models training, inference and serving

Stars: ✭ 71 (-96.86%)

Mutual labels: language-model

Xlnet Gen

XLNet for generating language.

Stars: ✭ 164 (-92.76%)

Mutual labels: language-model

Roberta zh

RoBERTa中文预训练模型: RoBERTa for Chinese

Stars: ✭ 1,953 (-13.74%)

Mutual labels: bert

Cross Domain ner

Cross-domain NER using cross-domain language modeling, code for ACL 2019 paper

Stars: ✭ 67 (-97.04%)

Mutual labels: language-model

Chineseglue

Language Understanding Evaluation benchmark for Chinese: datasets, baselines, pre-trained models,corpus and leaderboard

Stars: ✭ 1,548 (-31.63%)

Mutual labels: bert

Awesome Speech Recognition Speech Synthesis Papers

Automatic Speech Recognition (ASR), Speaker Verification, Speech Synthesis, Text-to-Speech (TTS), Language Modelling, Singing Voice Synthesis (SVS), Voice Conversion (VC)

Stars: ✭ 2,085 (-7.91%)

Mutual labels: language-model

Openseq2seq

Toolkit for efficient experimentation with Speech Recognition, Text2Speech and NLP

Stars: ✭ 1,378 (-39.13%)

Mutual labels: language-model

Spark Nlp

State of the Art Natural Language Processing

Stars: ✭ 2,518 (+11.22%)

Mutual labels: bert

Bert As Service

Mapping a variable-length sentence to a fixed-length vector using BERT model

Stars: ✭ 9,779 (+331.93%)

Mutual labels: bert

Tupe

Transformer with Untied Positional Encoding (TUPE). Code of paper "Rethinking Positional Encoding in Language Pre-training". Improve existing models like BERT.

Stars: ✭ 143 (-93.68%)

Mutual labels: language-model

Lotclass

[EMNLP 2020] Text Classification Using Label Names Only: A Language Model Self-Training Approach

Stars: ✭ 160 (-92.93%)

Mutual labels: language-model

Bit Rnn

Quantize weights and activations in Recurrent Neural Networks.

Stars: ✭ 86 (-96.2%)

Mutual labels: language-model

Mt Dnn

Multi-Task Deep Neural Networks for Natural Language Understanding

Stars: ✭ 1,871 (-17.36%)

Mutual labels: bert

Bio embeddings

Get protein embeddings from protein sequences

Stars: ✭ 86 (-96.2%)

Mutual labels: language-model

Pycorrector

pycorrector is a toolkit for text error correction. 文本纠错，Kenlm，Seq2Seq_Attention，BERT，MacBERT，ELECTRA，ERNIE，Transformer等模型实现，开箱即用。

Stars: ✭ 2,857 (+26.19%)

Mutual labels: bert

Nlp Tutorial

Natural Language Processing Tutorial for Deep Learning Researchers

Stars: ✭ 9,895 (+337.06%)

Mutual labels: bert

Awesome Bert

bert nlp papers, applications and github resources, including the newst xlnet ， BERT、XLNet 相关论文和 github 项目

Stars: ✭ 1,732 (-23.5%)

Mutual labels: bert

Nezha chinese pytorch

NEZHA: Neural Contextualized Representation for Chinese Language Understanding

Stars: ✭ 65 (-97.13%)

Mutual labels: language-model

F Lm

Language Modeling

Stars: ✭ 156 (-93.11%)

Mutual labels: language-model

Chars2vec

Character-based word embeddings model based on RNN for handling real world texts

Stars: ✭ 130 (-94.26%)

Mutual labels: language-model

Indonesian Language Models

Indonesian Language Models and its Usage

Stars: ✭ 64 (-97.17%)

Mutual labels: language-model

Gpt2

PyTorch Implementation of OpenAI GPT-2

Stars: ✭ 64 (-97.17%)

Mutual labels: language-model

Char rnn lm zh

language model in Chinese，基于Pytorch官方文档实现

Stars: ✭ 57 (-97.48%)

Mutual labels: language-model

Gpt Neo

An implementation of model parallel GPT2& GPT3-like models, with the ability to scale up to full GPT3 sizes (and possibly more!), using the mesh-tensorflow library.

Stars: ✭ 1,252 (-44.7%)

Mutual labels: language-model

Transformer Lm

Transformer language model (GPT-2) with sentencepiece tokenizer

Stars: ✭ 154 (-93.2%)

Mutual labels: language-model

Kogpt2 Finetuning

🔥 Korean GPT-2, KoGPT2 FineTuning cased. 한국어 가사 데이터 학습 🔥

Stars: ✭ 124 (-94.52%)

Mutual labels: language-model

Phonlp

PhoNLP: A BERT-based multi-task learning toolkit for part-of-speech tagging, named entity recognition and dependency parsing (NAACL 2021)

Stars: ✭ 56 (-97.53%)

Mutual labels: language-model

Vietnamese Electra

Electra pre-trained model using Vietnamese corpus

Stars: ✭ 55 (-97.57%)

Mutual labels: language-model

Dynamic Memory Networks Plus Pytorch

Implementation of Dynamic memory networks plus in Pytorch

Stars: ✭ 123 (-94.57%)

Mutual labels: language-model

Tner

Language model finetuning on NER with an easy interface, and cross-domain evaluation. We released NER models finetuned on various domain via huggingface model hub.

Stars: ✭ 54 (-97.61%)

Mutual labels: language-model

Suggest

Top-k Approximate String Matching.

Stars: ✭ 50 (-97.79%)

Mutual labels: language-model

Speecht

An opensource speech-to-text software written in tensorflow

Stars: ✭ 152 (-93.29%)

Mutual labels: language-model

Fast Bert

Super easy library for BERT based NLP models

Stars: ✭ 1,678 (-25.88%)

Mutual labels: bert

1-60 of 345 similar projects

›

next*5