All Projects → pbcquoc → vietnamese_word_seperate

pbcquoc / vietnamese_word_seperate

Licence: other
Seperate vietnamese using lstm

Programming Languages

Jupyter Notebook
11667 projects
python
139335 projects - #7 most used programming language

Projects that are alternatives of or similar to vietnamese word seperate

lstm-crf-tagging
No description or website provided.
Stars: ✭ 13 (+0%)
Mutual labels:  vietnamese, lstm
AutoSleepScorer
An open-source sleep stage classification Python package
Stars: ✭ 85 (+553.85%)
Mutual labels:  lstm
Gradient-Samples
Samples for TensorFlow binding for .NET by Lost Tech
Stars: ✭ 53 (+307.69%)
Mutual labels:  lstm
time-series-forecasting-tensorflowjs
Pull stock prices from online API and perform predictions using Long Short Term Memory (LSTM) with TensorFlow.js framework
Stars: ✭ 96 (+638.46%)
Mutual labels:  lstm
Deep-Learning-for-Expression-Recognition-in-Image-Sequences
The project uses state of the art deep learning on collected data for automatic analysis of emotions.
Stars: ✭ 26 (+100%)
Mutual labels:  lstm
Userscript
Userscripts collection written by me
Stars: ✭ 92 (+607.69%)
Mutual labels:  vietnamese
rnn2d
CPU and GPU implementations of some 2D RNN layers
Stars: ✭ 26 (+100%)
Mutual labels:  lstm
knowledge-graph-nlp-in-action
从模型训练到部署,实战知识图谱(Knowledge Graph)&自然语言处理(NLP)。涉及 Tensorflow, Bert+Bi-LSTM+CRF,Neo4j等 涵盖 Named Entity Recognition,Text Classify,Information Extraction,Relation Extraction 等任务。
Stars: ✭ 58 (+346.15%)
Mutual labels:  lstm
rl implementations
No description or website provided.
Stars: ✭ 40 (+207.69%)
Mutual labels:  lstm
Persian-Sentiment-Analyzer
Persian sentiment analysis ( آناکاوی سهش های فارسی | تحلیل احساسات فارسی )
Stars: ✭ 30 (+130.77%)
Mutual labels:  lstm
Stock-Prediction
LSTM RNN for sentiment-based stock prediction
Stars: ✭ 50 (+284.62%)
Mutual labels:  lstm
Sequence-Models-coursera
Sequence Models by Andrew Ng on Coursera. Programming Assignments and Quiz Solutions.
Stars: ✭ 53 (+307.69%)
Mutual labels:  lstm
autonomio
Core functionality for the Autonomio augmented intelligence workbench.
Stars: ✭ 27 (+107.69%)
Mutual labels:  lstm
DeepSentiPers
Repository for the experiments described in the paper named "DeepSentiPers: Novel Deep Learning Models Trained Over Proposed Augmented Persian Sentiment Corpus"
Stars: ✭ 17 (+30.77%)
Mutual labels:  lstm
CS231n
My solutions for Assignments of CS231n: Convolutional Neural Networks for Visual Recognition
Stars: ✭ 30 (+130.77%)
Mutual labels:  lstm
UETsegmenter
A toolkit for Vietnamese word segmentation
Stars: ✭ 60 (+361.54%)
Mutual labels:  vietnamese
battery-rul-estimation
Remaining Useful Life (RUL) estimation of Lithium-ion batteries using deep LSTMs
Stars: ✭ 25 (+92.31%)
Mutual labels:  lstm
totally humans
rnn trained on r/totallynotrobots 🤖
Stars: ✭ 23 (+76.92%)
Mutual labels:  lstm
virnet
VirNet: A deep attention model for viral reads identification
Stars: ✭ 26 (+100%)
Mutual labels:  lstm
HTR-ctc
Pytorch implementation of HTR on IAM dataset (word or line level + CTC loss)
Stars: ✭ 15 (+15.38%)
Mutual labels:  lstm

LSTM

Giới thiệu

LSTM là một loại mô hình thuộc kiến trúc RNN, mô hình này có thể học được những mối quan hệ lâu dài, được giới thiệu bởi Hochreiter & Schmidhuber và sau này thì sử dụng rỗng rãi trong những bài toán khác nhau về ngôn ngữ.

Mô tả bài toán

Để kiểm tra khả năng tách các từ dính liền với nhau của mạng LSTM, mình sử dụng bộ dữ liệu thu thập từ các trang báo mạng như Vnexpess, Vietnamnet, ... Sau đó, xóa tất cả các khoảng trắng, để nối các từ lại. Dữ liệu này dùng để mô hình học. Dữ liệu dùng để mình họa quá trình học cũng như các đặc trưng học được của LSTM.

Tiền xử lý

Dữ liệu thu thập được trên các báo mạng gần như chuẩn, do đó, mình chỉ remove các dấu câu. Toàn bộ câu chữ được giữ nguyên. Dữ liệu huấn luyện được thể hiện dưới bảng sau:

Input Output
riêngởxứlạnhkhôngbaogiờcóve riêng ở xứ lạnh không bao giờ có ve
trẻemtheongườilớnvuiđóntết trẻ em theo người lớn vui đón tết
bệnhnhânphảinằmđiềutrịcáchly bệnh nhân phải nằm điều trị cách ly

Mô hình

Mình sử dụng mô hình sequence2sequence truyền thống để giải quyết bài toán đã ra. Mô hình bao gồm một mạng LSTM encoder và LSTM decoder. Kết quả output của decoder được qua tầng Fully connected, sau đó qua softmax để tìm xác suất từ dự đoán. model

Dependences

  • Keras
  • Tensorflow
  • Anaconda 3.6

Train

Kết quả

References

Hochreiter, S., & Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8), 1735-1780.

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].