All Projects → Xlnet_zh → Similar Projects or Alternatives

152 Open source projects that are alternatives of or similar to Xlnet_zh

🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.

Stars: ✭ 55,742 (+26828.5%)

🐥A PyTorch implementation of OpenAI's finetuned transformer language model with a script to import the weights pre-trained by OpenAI

Stars: ✭ 1,268 (+512.56%)

Mutual labels: language-model

Electra pytorch

Pretrain and finetune ELECTRA with fastai and huggingface. (Results of the paper replicated !)

Stars: ✭ 149 (-28.02%)

Mutual labels: language-model

Haystack

🔍 Haystack is an open source NLP framework that leverages Transformer models. It enables developers to implement production-ready neural search, question answering, semantic document search and summarization for a wide range of applications.

Stars: ✭ 3,409 (+1546.86%)

Mutual labels: language-model

Char rnn lm zh

language model in Chinese，基于Pytorch官方文档实现

Stars: ✭ 57 (-72.46%)

Mutual labels: language-model

Keras Xlnet

Implementation of XLNet that can load pretrained checkpoints

Stars: ✭ 159 (-23.19%)

Mutual labels: language-model

Pyclue

Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark

Stars: ✭ 91 (-56.04%)

Mutual labels: language-model

Keras Bert

Implementation of BERT that could load official pre-trained models for feature extraction and prediction

Stars: ✭ 2,264 (+993.72%)

Mutual labels: language-model

Nezha chinese pytorch

NEZHA: Neural Contextualized Representation for Chinese Language Understanding

Stars: ✭ 65 (-68.6%)

Mutual labels: language-model

Ld Net

Efficient Contextualized Representation: Language Model Pruning for Sequence Labeling

Stars: ✭ 148 (-28.5%)

Mutual labels: language-model

Dynamic Memory Networks Plus Pytorch

Implementation of Dynamic memory networks plus in Pytorch

Stars: ✭ 123 (-40.58%)

Mutual labels: language-model

Suggest

Top-k Approximate String Matching.

Stars: ✭ 50 (-75.85%)

Mutual labels: language-model

Lazynlp

Library to scrape and clean web pages to create massive datasets.

Stars: ✭ 1,985 (+858.94%)

Mutual labels: language-model

Keras Gpt 2

Load GPT-2 checkpoint and generate texts

Stars: ✭ 113 (-45.41%)

Mutual labels: language-model

Bert As Language Model

bert as language model, fork from https://github.com/google-research/bert

Stars: ✭ 185 (-10.63%)

Mutual labels: language-model

Openseq2seq

Toolkit for efficient experimentation with Speech Recognition, Text2Speech and NLP

Stars: ✭ 1,378 (+565.7%)

Mutual labels: language-model

Transformer Lm

Transformer language model (GPT-2) with sentencepiece tokenizer

Stars: ✭ 154 (-25.6%)

Mutual labels: language-model

Text Gan Tensorflow

TensorFlow GAN implementation using Gumbel Softmax

Stars: ✭ 87 (-57.97%)

Mutual labels: language-model

Gpt Scrolls

A collaborative collection of open-source safe GPT-3 prompts that work well

Stars: ✭ 195 (-5.8%)

Mutual labels: language-model

Greek Bert

A Greek edition of BERT pre-trained language model

Stars: ✭ 84 (-59.42%)

Mutual labels: language-model

Awd Lstm Lm

LSTM and QRNN Language Model Toolkit for PyTorch

Stars: ✭ 1,834 (+785.99%)

Mutual labels: language-model

Indonesian Language Models

Indonesian Language Models and its Usage

Stars: ✭ 64 (-69.08%)

Mutual labels: language-model

Macbert

Revisiting Pre-trained Models for Chinese Natural Language Processing (Findings of EMNLP)

Stars: ✭ 167 (-19.32%)

Mutual labels: language-model

Vietnamese Electra

Electra pre-trained model using Vietnamese corpus

Stars: ✭ 55 (-73.43%)

Mutual labels: language-model

Clue

中文语言理解测评基准 Chinese Language Understanding Evaluation Benchmark: datasets, baselines, pre-trained models, corpus and leaderboard

Stars: ✭ 2,425 (+1071.5%)

Mutual labels: language-model

Kogpt2 Finetuning

🔥 Korean GPT-2, KoGPT2 FineTuning cased. 한국어 가사 데이터 학습 🔥

Stars: ✭ 124 (-40.1%)

Mutual labels: language-model

Lmchallenge

A library & tools to evaluate predictive language models.

Stars: ✭ 47 (-77.29%)

Mutual labels: language-model

Xlnet Gen

XLNet for generating language.

Stars: ✭ 164 (-20.77%)

Mutual labels: language-model

Robbert

A Dutch RoBERTa-based language model

Stars: ✭ 120 (-42.03%)

Mutual labels: language-model

Nlp learning

结合python一起学习自然语言处理 (nlp): 语言模型、HMM、PCFG、Word2vec、完形填空式阅读理解任务、朴素贝叶斯分类器、TFIDF、PCA、SVD

Stars: ✭ 188 (-9.18%)

Mutual labels: language-model

Lingo

package lingo provides the data structures and algorithms required for natural language processing

Stars: ✭ 113 (-45.41%)

Mutual labels: language-model

Lotclass

[EMNLP 2020] Text Classification Using Label Names Only: A Language Model Self-Training Approach

Stars: ✭ 160 (-22.71%)

Mutual labels: language-model

Getlang

Natural language detection package in pure Go

Stars: ✭ 110 (-46.86%)

Mutual labels: language-model

Protein Sequence Embedding Iclr2019

Source code for "Learning protein sequence embeddings using information from structure" - ICLR 2019

Stars: ✭ 194 (-6.28%)

Mutual labels: language-model

Easy Bert

A Dead Simple BERT API for Python and Java (https://github.com/google-research/bert)

Stars: ✭ 106 (-48.79%)

Mutual labels: language-model

F Lm

Language Modeling

Stars: ✭ 156 (-24.64%)

Mutual labels: language-model

Pytorch gbw lm

PyTorch Language Model for 1-Billion Word (LM1B / GBW) Dataset

Stars: ✭ 101 (-51.21%)

Mutual labels: language-model

Bert Sklearn

a sklearn wrapper for Google's BERT model

Stars: ✭ 182 (-12.08%)

Mutual labels: language-model

Tongrams

A C++ library providing fast language model queries in compressed space.

Stars: ✭ 88 (-57.49%)

Mutual labels: language-model

Speecht

An opensource speech-to-text software written in tensorflow

Stars: ✭ 152 (-26.57%)

Mutual labels: language-model

Bit Rnn

Quantize weights and activations in Recurrent Neural Networks.

Stars: ✭ 86 (-58.45%)

Mutual labels: language-model

Attention Mechanisms

Implementations for a family of attention mechanisms, suitable for all kinds of natural language processing tasks and compatible with TensorFlow 2.0 and Keras.

Stars: ✭ 203 (-1.93%)

Mutual labels: language-model

Bio embeddings

Get protein embeddings from protein sequences

Stars: ✭ 86 (-58.45%)

Mutual labels: language-model

Awesome Sentence Embedding

A curated list of pretrained sentence and word embedding models

Stars: ✭ 1,973 (+853.14%)

Mutual labels: language-model

Full stack transformer

Pytorch library for end-to-end transformer models training, inference and serving

Stars: ✭ 71 (-65.7%)

Mutual labels: language-model

Optimus

Optimus: the first large-scale pre-trained VAE language model

Stars: ✭ 180 (-13.04%)

Mutual labels: language-model

Cross Domain ner

Cross-domain NER using cross-domain language modeling, code for ACL 2019 paper

Stars: ✭ 67 (-67.63%)

Mutual labels: language-model

Awesome Speech Recognition Speech Synthesis Papers

Automatic Speech Recognition (ASR), Speaker Verification, Speech Synthesis, Text-to-Speech (TTS), Language Modelling, Singing Voice Synthesis (SVS), Voice Conversion (VC)

Stars: ✭ 2,085 (+907.25%)

Mutual labels: language-model

Gpt2

PyTorch Implementation of OpenAI GPT-2

Stars: ✭ 64 (-69.08%)

Mutual labels: language-model

Char Rnn Chinese

Multi-layer Recurrent Neural Networks (LSTM, GRU, RNN) for character-level language models in Torch. Based on code of https://github.com/karpathy/char-rnn. Support Chinese and other things.

Stars: ✭ 192 (-7.25%)

Mutual labels: language-model

Phonlp

PhoNLP: A BERT-based multi-task learning toolkit for part-of-speech tagging, named entity recognition and dependency parsing (NAACL 2021)

Stars: ✭ 56 (-72.95%)

Mutual labels: language-model

Tupe

Transformer with Untied Positional Encoding (TUPE). Code of paper "Rethinking Positional Encoding in Language Pre-training". Improve existing models like BERT.

Stars: ✭ 143 (-30.92%)

Mutual labels: language-model

Tner

Language model finetuning on NER with an easy interface, and cross-domain evaluation. We released NER models finetuned on various domain via huggingface model hub.

Stars: ✭ 54 (-73.91%)

Mutual labels: language-model

Gpt Neo

An implementation of model parallel GPT2& GPT3-like models, with the ability to scale up to full GPT3 sizes (and possibly more!), using the mesh-tensorflow library.

Stars: ✭ 1,252 (+504.83%)

Mutual labels: language-model

Electra

中文预训练 ELECTRA 模型: 基于对抗学习 pretrain Chinese Model

Stars: ✭ 132 (-36.23%)

Mutual labels: language-model

Pytorch Nce

The Noise Contrastive Estimation for softmax output written in Pytorch

Stars: ✭ 204 (-1.45%)

Mutual labels: language-model

Lingvo

Stars: ✭ 2,361 (+1040.58%)