zhpmatrix / Bert Sequence Tagging
基于BERT的中文序列标注
Stars: ✭ 137
Programming Languages
python
139335 projects - #7 most used programming language
Labels
Projects that are alternatives of or similar to Bert Sequence Tagging
Awesome Macos Command Line Zh
用你的 macOS 终端搞事情。(Use your macOS terminal shell to do awesome things. )
Stars: ✭ 117 (-14.6%)
Mutual labels: chinese
Lgt8fx
Board Package for Logic Green LGT8F328P LGT8F328D and LGT8F88D
Stars: ✭ 122 (-10.95%)
Mutual labels: chinese
Dotnetbook
.NET Platform Architecture book (English, Chinese, Russian)
Stars: ✭ 1,763 (+1186.86%)
Mutual labels: chinese
Datasets
Poetry-related datasets developed by THUAIPoet (Jiuge) group.
Stars: ✭ 111 (-18.98%)
Mutual labels: chinese
Ehviewer
前任作者NekoInverter在gitlab重新更新EhViewer了,我不再独立维护项目,本项目暂时封存。 请前往 https://gitlab.com/NekoInverter/EhViewer 获取最新版本。
Stars: ✭ 127 (-7.3%)
Mutual labels: chinese
Ncchineseconverter
NCChineseConverter 是一个基于 Objective-C 的中文简繁正转换库.
Stars: ✭ 117 (-14.6%)
Mutual labels: chinese
Gse
Go efficient multilingual NLP and text segmentation; support english, chinese, japanese and other. Go 高性能多语言 NLP 和分词
Stars: ✭ 1,695 (+1137.23%)
Mutual labels: chinese
Data
中国政治和社会事件时间线数据仓库 Database for the timeline of political and societal events in China
Stars: ✭ 117 (-14.6%)
Mutual labels: chinese
Docs Cn
OpenTelemetry Markdown中文文档: 接入使用、技术标准、RFC、SDK等. 中文网站:https://ot.md
Stars: ✭ 109 (-20.44%)
Mutual labels: chinese
The Road To Learn React Chinese
《React 学习之道》The Road to learn React (简体中文版) | 最简单,且最实用的 React 实战教程。
Stars: ✭ 1,631 (+1090.51%)
Mutual labels: chinese
U8g2 wqy
适合 u8g2 的中文字体,采用文泉驿点阵宋体作为源本,提供 12x12、13x13、14x14、15x15 和 16x16 点阵字库。
Stars: ✭ 137 (+0%)
Mutual labels: chinese
Chinese Colors
🇨🇳🎨Chinese traditional color cheatsheet online
Stars: ✭ 1,788 (+1205.11%)
Mutual labels: chinese
Tensorflow Facenet
人脸识别算法,结合facenet网络结构和center loss作为损失,基于tensorflow框架,含训练和测试代码,支持从头训练和摄像头测试
Stars: ✭ 127 (-7.3%)
Mutual labels: chinese
bert-sequence-tagging
基于BERT的中文序列标注
BERT的一作Jacob说他不准备放出序列标注的代码,不过你可以在issues中看到Jacob参与的讨论。
该Repo不是可以直接运行的,不过如果你真的需要这个实现,很大程度上应该一看就能明白。
sequence tagging可以用在很多地方,NER, POS等,也许最近的天池瑞金比赛也可以尝试,Kaggle最新的一个文本分类的比赛也可以尝试,不过Kaggle的这个新赛直接使用Jacob公布的代码应该不需要修改很多地方。
基于google-bert源代码,写sequence tagging模块,并在IJCNLP的CGED数据上做了初步测试,实验结果如下图所示。
其中,最上图是2017年哈工大的一个组公布的代码C++跑出的结果;中图是我用Tensorflow复现出的结果;下图是基于BERT做fine-tuning得到的一个结果。
从结果上来看,实现上暂时看起来似乎没有问题。
Note that the project description data, including the texts, logos, images, and/or trademarks,
for each open source project belongs to its rightful owner.
If you wish to add or remove any projects, please contact us at [email protected].