All Projects → undertheseanlp → automatic_speech_recognition

undertheseanlp / automatic_speech_recognition

Licence: GPL-3.0 License
Vietnamese Automatic Speech Recognition

Programming Languages

python
139335 projects - #7 most used programming language
TeX
3793 projects
shell
77523 projects
perl
6916 projects
Jupyter Notebook
11667 projects

Projects that are alternatives of or similar to automatic speech recognition

demo vietasr
Vietnamese Speech Recognition
Stars: ✭ 22 (-62.07%)
Mutual labels:  automatic-speech-recognition, vietnamese-nlp
Vietnamese-Accent-Prediction
A simple/fast/accurate accent prediction for non-accented Vietnamese text
Stars: ✭ 31 (-46.55%)
Mutual labels:  vietnamese, vietnamese-nlp
vietnamese-roberta
A Robustly Optimized BERT Pretraining Approach for Vietnamese
Stars: ✭ 22 (-62.07%)
Mutual labels:  vietnamese, vietnamese-nlp
classification
Vietnamese Text Classification
Stars: ✭ 39 (-32.76%)
Mutual labels:  vietnamese, vietnamese-nlp
word tokenize
Vietnamese Word Tokenize
Stars: ✭ 45 (-22.41%)
Mutual labels:  vietnamese, vietnamese-nlp
deep avsr
A PyTorch implementation of the Deep Audio-Visual Speech Recognition paper.
Stars: ✭ 104 (+79.31%)
Mutual labels:  automatic-speech-recognition
SpeakIt Vietnamese TTS
Vietnamese Text-to-Speech on Windows Project (zalo-speech)
Stars: ✭ 81 (+39.66%)
Mutual labels:  vietnamese
kaldi helpers
🙊 A set of scripts to use in preparing a corpus for speech-to-text processing with the Kaldi Automatic Speech Recognition Library.
Stars: ✭ 13 (-77.59%)
Mutual labels:  automatic-speech-recognition
wenet
Production First and Production Ready End-to-End Speech Recognition Toolkit
Stars: ✭ 2,384 (+4010.34%)
Mutual labels:  automatic-speech-recognition
Userscript
Userscripts collection written by me
Stars: ✭ 92 (+58.62%)
Mutual labels:  vietnamese
tudien
Từ điển tiếng Việt dành cho Kindle
Stars: ✭ 38 (-34.48%)
Mutual labels:  vietnamese
google assistant vietnamese speaking
Đây là dự án độ lại loa thông minh chạy Google Assistant hỗ trợ đa ngôn ngữ trong đó có tiếng Việt, phần source code do Nguyễn Duy code lại từ Source Gốc của Google
Stars: ✭ 19 (-67.24%)
Mutual labels:  vietnamese
UETsegmenter
A toolkit for Vietnamese word segmentation
Stars: ✭ 60 (+3.45%)
Mutual labels:  vietnamese
vietnamese word seperate
Seperate vietnamese using lstm
Stars: ✭ 13 (-77.59%)
Mutual labels:  vietnamese
Speech-Recognition
End-to-End Speech Recognition using Neural Networks.
Stars: ✭ 31 (-46.55%)
Mutual labels:  automatic-speech-recognition
number-to-words
⚡ Thư viện hổ trợ chuyển đổi số sang chữ số Tiếng Việt.
Stars: ✭ 19 (-67.24%)
Mutual labels:  vietnamese
kaldi-long-audio-alignment
Long audio alignment using Kaldi
Stars: ✭ 21 (-63.79%)
Mutual labels:  automatic-speech-recognition
soxan
Wav2Vec for speech recognition, classification, and audio classification
Stars: ✭ 113 (+94.83%)
Mutual labels:  automatic-speech-recognition
IR-GAN
Augmenting Room Impulse Response
Stars: ✭ 21 (-63.79%)
Mutual labels:  automatic-speech-recognition
TALPCo
TUFS Asian Language Parallel Corpus
Stars: ✭ 32 (-44.83%)
Mutual labels:  vietnamese

Nhận dạng tiếng nói tiếng Việt

Dự án nghiên cứu về bài toán Nhận dạng tiếng nói tiếng Việt, được phát triển bởi nhóm nghiên cứu xử lý ngôn ngữ tự nhiên tiếng Việt - undertheseanlp. Chứa mã nguồn các thử nghiệm cho việc xử lý dữ liệu, huấn luyện và đánh giá mô hình, cũng như cho phép dễ dàng tùy chỉnh mô hình đối với những tập dữ liệu mới.

Nhóm tác giả

Tham gia đóng góp

Mọi ý kiến đóng góp hoặc yêu cầu trợ giúp xin gửi vào mục Issues của dự án. Các thảo luận được khuyến khích sử dụng tiếng Việt để dễ dàng trong quá trình trao đổi.

Nếu bạn có kinh nghiệm trong bài toán này, muốn tham gia vào nhóm phát triển với vai trò là Developer, xin hãy đọc kỹ Hướng dẫn tham gia đóng góp.

Mục lục

Yêu cầu hệ thống

  • Hệ điều hành: Ubuntu 16.04
  • Python 3.6+
  • conda 4+

Thiết lập môi trường

Cài đặt Kaldi

Để cài đặt Kaldi, thực hiện theo các bước tại hướng dẫn

$ git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden

$ cd kaldi-trunk/tools/; make;

$ extras/install_openblas.sh

$ cd ../src; ./configure  --openblas-root=../tools/OpenBLAS/install; make

Cài đặt language modeling toolkit srilm

Cài đặt dependencies

$ apt-get install gawk

Cài đặt srilm

$ cd kaldi-trunk/tools
$ wget -O srilm.tgz https://raw.githubusercontent.com/denizyuret/nlpcourse/master/download/srilm-1.7.0.tgz
$ ./install_srilm.sh
...
Installation of SRILM finished successfully
Please source the tools/env.sh in your path.sh to enable it

Hướng dẫn sử dụng

Huấn luyện mô hình

Mô tả dữ liệu: Xem chi tiết

Trước khi run train.py phải set lại đường dẫn tới kaldi_folder .

Method predict nên có thêm argument model_path nếu bạn đã thực hiện train trước đó (vì nếu không nó sẽ lấy theo tmp_path của model, mà tmp_path này random cho mỗi lần khởi tạo lại model để chuẩn bị cho việc chạy training mới)

Thay đổi N_TRAIN và N_TEST trong init của KaldiSpeechRecognition để đổi giới hạn tập train/test

Output folder sẽ nằm trong kaldi_folder/egs/uts_{tmp_number} với tmp_number được thấy khi run train.py (EX: "Init Kaldi Speech Recognition in number_of_tmp folder" - Will be updated soon)

Kết quả thử nghiệm

Huấn luyện trên tập dữ liệu VIVOS - OpenFPT, test trên tập VLSP 2018

Mô hình WER
GMM: MFCC + delta + LDA + MLTT 75.27%

Huấn luyện trên tập dữ liệu VIVOS, test trên tập VLSP 2018

Mô hình WER
GMM: MFCC + delta + LDA + MLTT 79.80%
GMM: MFCC + delta 82.03%

Bản quyền

Mã nguồn của dự án được phân phối theo giấy phép GPL-3.0.

Dự án sử dụng tập dữ liệu VIVOS trong các thử nghiệm. Xin vui lòng kiểm tra lại thông tin trên website hoặc báo cáo khoa học tương ứng để biết thông tin về bản quyền và trích dẫn khi sử dụng tập dữ liệu này.

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].