All Projects → zhpmatrix → Bert Sequence Tagging

zhpmatrix / Bert Sequence Tagging

基于BERT的中文序列标注

Programming Languages

python
139335 projects - #7 most used programming language

Labels

Projects that are alternatives of or similar to Bert Sequence Tagging

Blog
部署在 GitBook 上的个人博客。
Stars: ✭ 112 (-18.25%)
Mutual labels:  chinese
Awesome Chinese Podcasts
一些不错的中文podcasts
Stars: ✭ 124 (-9.49%)
Mutual labels:  chinese
Awesome Erlang Cn
Erlang资源大全中文版
Stars: ✭ 129 (-5.84%)
Mutual labels:  chinese
Awesome Macos Command Line Zh
用你的 macOS 终端搞事情。(Use your macOS terminal shell to do awesome things. )
Stars: ✭ 117 (-14.6%)
Mutual labels:  chinese
Lgt8fx
Board Package for Logic Green LGT8F328P LGT8F328D and LGT8F88D
Stars: ✭ 122 (-10.95%)
Mutual labels:  chinese
Dotnetbook
.NET Platform Architecture book (English, Chinese, Russian)
Stars: ✭ 1,763 (+1186.86%)
Mutual labels:  chinese
Datasets
Poetry-related datasets developed by THUAIPoet (Jiuge) group.
Stars: ✭ 111 (-18.98%)
Mutual labels:  chinese
Gpy
Go 语言汉字转拼音工具
Stars: ✭ 136 (-0.73%)
Mutual labels:  chinese
Rustbookschina
记录国内的Rust书籍与文章
Stars: ✭ 123 (-10.22%)
Mutual labels:  chinese
Ehviewer
前任作者NekoInverter在gitlab重新更新EhViewer了,我不再独立维护项目,本项目暂时封存。 请前往 https://gitlab.com/NekoInverter/EhViewer 获取最新版本。
Stars: ✭ 127 (-7.3%)
Mutual labels:  chinese
Ncchineseconverter
NCChineseConverter 是一个基于 Objective-C 的中文简繁正转换库.
Stars: ✭ 117 (-14.6%)
Mutual labels:  chinese
Gse
Go efficient multilingual NLP and text segmentation; support english, chinese, japanese and other. Go 高性能多语言 NLP 和分词
Stars: ✭ 1,695 (+1137.23%)
Mutual labels:  chinese
Cluedatasetsearch
搜索所有中文NLP数据集,附常用英文NLP数据集
Stars: ✭ 2,112 (+1441.61%)
Mutual labels:  chinese
Data
中国政治和社会事件时间线数据仓库 Database for the timeline of political and societal events in China
Stars: ✭ 117 (-14.6%)
Mutual labels:  chinese
Roberta zh
RoBERTa中文预训练模型: RoBERTa for Chinese
Stars: ✭ 1,953 (+1325.55%)
Mutual labels:  chinese
Docs Cn
OpenTelemetry Markdown中文文档: 接入使用、技术标准、RFC、SDK等. 中文网站:https://ot.md
Stars: ✭ 109 (-20.44%)
Mutual labels:  chinese
The Road To Learn React Chinese
《React 学习之道》The Road to learn React (简体中文版) | 最简单,且最实用的 React 实战教程。
Stars: ✭ 1,631 (+1090.51%)
Mutual labels:  chinese
U8g2 wqy
适合 u8g2 的中文字体,采用文泉驿点阵宋体作为源本,提供 12x12、13x13、14x14、15x15 和 16x16 点阵字库。
Stars: ✭ 137 (+0%)
Mutual labels:  chinese
Chinese Colors
🇨🇳🎨Chinese traditional color cheatsheet online
Stars: ✭ 1,788 (+1205.11%)
Mutual labels:  chinese
Tensorflow Facenet
人脸识别算法,结合facenet网络结构和center loss作为损失,基于tensorflow框架,含训练和测试代码,支持从头训练和摄像头测试
Stars: ✭ 127 (-7.3%)
Mutual labels:  chinese

bert-sequence-tagging

基于BERT的中文序列标注

BERT的一作Jacob说他不准备放出序列标注的代码,不过你可以在issues中看到Jacob参与的讨论。

该Repo不是可以直接运行的,不过如果你真的需要这个实现,很大程度上应该一看就能明白。

sequence tagging可以用在很多地方,NER, POS等,也许最近的天池瑞金比赛也可以尝试,Kaggle最新的一个文本分类的比赛也可以尝试,不过Kaggle的这个新赛直接使用Jacob公布的代码应该不需要修改很多地方。

基于google-bert源代码,写sequence tagging模块,并在IJCNLP的CGED数据上做了初步测试,实验结果如下图所示。

实验结果

其中,最上图是2017年哈工大的一个组公布的代码C++跑出的结果;中图是我用Tensorflow复现出的结果;下图是基于BERT做fine-tuning得到的一个结果。

从结果上来看,实现上暂时看起来似乎没有问题。

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].