All Projects → SophonPlus → Chinesenlpcorpus

SophonPlus / Chinesenlpcorpus

搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。

Programming Languages

Jupyter Notebook
11667 projects

Projects that are alternatives of or similar to Chinesenlpcorpus

Vimpyter
Edit your Jupyter notebooks in Vim/Neovim
Stars: ✭ 308 (-91.78%)
Mutual labels:  jupyter-notebook
Keras Multiprocess Image Data Generator
Accelerating Deep Learning with Multiprocess Image Augmentation in Keras
Stars: ✭ 310 (-91.72%)
Mutual labels:  jupyter-notebook
Tianchi Medical Lungtumordetect
天池医疗AI大赛[第一季]:肺部结节智能诊断 UNet/VGG/Inception/ResNet/DenseNet
Stars: ✭ 314 (-91.62%)
Mutual labels:  jupyter-notebook
Apricot
apricot implements submodular optimization for the purpose of selecting subsets of massive data sets to train machine learning models quickly. See the documentation page: https://apricot-select.readthedocs.io/en/latest/index.html
Stars: ✭ 306 (-91.83%)
Mutual labels:  jupyter-notebook
Pandas Data Science Tasks
Set of real world data science tasks completed using the Python Pandas library
Stars: ✭ 311 (-91.7%)
Mutual labels:  jupyter-notebook
Dlcourse ai
Материалы курса Deep Learning на пальцах
Stars: ✭ 310 (-91.72%)
Mutual labels:  jupyter-notebook
A3c trading
Trading with recurrent actor-critic reinforcement learning
Stars: ✭ 305 (-91.86%)
Mutual labels:  jupyter-notebook
Tx Word2vec Small
腾讯word2vec模型缩小版
Stars: ✭ 313 (-91.64%)
Mutual labels:  jupyter-notebook
Biosentvec
BioWordVec & BioSentVec: pre-trained embeddings for biomedical words and sentences
Stars: ✭ 308 (-91.78%)
Mutual labels:  jupyter-notebook
Thstrader
量化交易。同花顺免费模拟炒股软件客户端的python API。(Python3)
Stars: ✭ 311 (-91.7%)
Mutual labels:  jupyter-notebook
Erlemar.github.io
Data science portfolio
Stars: ✭ 309 (-91.75%)
Mutual labels:  jupyter-notebook
Tensorflow Handbook
简单粗暴 TensorFlow 2 | A Concise Handbook of TensorFlow 2 | 一本简明的 TensorFlow 2 入门指导教程
Stars: ✭ 3,616 (-3.47%)
Mutual labels:  jupyter-notebook
Test Stock Prediction Algorithms
Use deep learning, genetic programming and other methods to predict stock and market movements
Stars: ✭ 312 (-91.67%)
Mutual labels:  jupyter-notebook
Attention Analysis
Stars: ✭ 307 (-91.8%)
Mutual labels:  jupyter-notebook
Tensorflow Image Classification
CNN for multi-class image recognition in tensorflow
Stars: ✭ 312 (-91.67%)
Mutual labels:  jupyter-notebook
Recsys
项亮的《推荐系统实践》的代码实现
Stars: ✭ 306 (-91.83%)
Mutual labels:  jupyter-notebook
Statistics For Engineers
Statistics Tutorial for IT Operations Engineers
Stars: ✭ 310 (-91.72%)
Mutual labels:  jupyter-notebook
Reinforcement Learning
Learn Deep Reinforcement Learning in 60 days! Lectures & Code in Python. Reinforcement Learning + Deep Learning
Stars: ✭ 3,329 (-11.13%)
Mutual labels:  jupyter-notebook
Shapematchinggan
[ICCV 2019, Oral] Controllable Artistic Text Style Transfer via Shape-Matching GAN
Stars: ✭ 315 (-91.59%)
Mutual labels:  jupyter-notebook
Adaptis
[ICCV19] AdaptIS: Adaptive Instance Selection Network, https://arxiv.org/abs/1909.07829
Stars: ✭ 314 (-91.62%)
Mutual labels:  jupyter-notebook

ChineseNlpCorpus

搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。

情感/观点/评论 倾向性分析

数据集 数据概览 下载地址
ChnSentiCorp_htl_all 7000 多条酒店评论数据,5000 多条正向评论,2000 多条负向评论 点击查看
waimai_10k 某外卖平台收集的用户评价,正向 4000 条,负向 约 8000 条 点击查看
online_shopping_10_cats 10 个类别,共 6 万多条评论数据,正、负向评论各约 3 万条,
包括书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店
点击查看
weibo_senti_100k 10 万多条,带情感标注 新浪微博,正负向评论约各 5 万条 点击查看
simplifyweibo_4_moods 36 万多条,带情感标注 新浪微博,包含 4 种情感,
其中喜悦约 20 万条,愤怒、厌恶、低落各约 5 万条
点击查看
dmsc_v2 28 部电影,超 70 万 用户,超 200 万条 评分/评论 数据 点击查看
yf_dianping 24 万家餐馆,54 万用户,440 万条评论/评分数据 点击查看
yf_amazon 52 万件商品,1100 多个类目,142 万用户,720 万条评论/评分数据 点击查看

中文命名实体识别

数据集 数据概览 下载地址
dh_msra 5 万多条中文命名实体识别标注数据(包括地点、机构、人物) 点击查看

推荐系统

数据集 数据概览 下载地址
ez_douban 5 万多部电影(3 万多有电影名称,2 万多没有电影名称),2.8 万 用户,280 万条评分数据 点击查看
dmsc_v2 28 部电影,超 70 万 用户,超 200 万条 评分/评论 数据 点击查看
yf_dianping 24 万家餐馆,54 万用户,440 万条评论/评分数据 点击查看
yf_amazon 52 万件商品,1100 多个类目,142 万用户,720 万条评论/评分数据 点击查看

FAQ 问答系统

数据集 数据概览 下载地址
保险知道 8000 多条保险行业问答数据,包括用户提问、网友回答、最佳回答 点击查看
安徽电信知道 15.6 万条电信问答数据,包括用户提问、网友回答、最佳回答 点击查看
金融知道 77 万条金融行业问答数据,包括用户提问、网友回答、最佳回答 点击查看
法律知道 3.6 万条法律问答数据,包括用户提问、网友回答、最佳回答 点击查看
联通知道 20.3 万条联通问答数据,包括用户提问、网友回答、最佳回答 点击查看
农行知道 4 万条农业银行问答数据,包括用户提问、网友回答、最佳回答 点击查看
保险知道 58.8 万条保险行业问答数据,包括用户提问、网友回答、最佳回答 点击查看

加入我们

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].