All Projects → MengLingchao → Chinese_financial_sentiment_dictionary

MengLingchao / Chinese_financial_sentiment_dictionary

Licence: other
A Chinese financial sentiment word dictionary

Projects that are alternatives of or similar to Chinese financial sentiment dictionary

CLUEmotionAnalysis2020
CLUE Emotion Analysis Dataset 细粒度情感分析数据集
Stars: ✭ 3 (-95.52%)
Mutual labels:  sentiment-analysis, chinese
Stocker
Financial Web Scraper & Sentiment Classifier
Stars: ✭ 87 (+29.85%)
Mutual labels:  finance, sentiment-analysis
Cluedatasetsearch
搜索所有中文NLP数据集,附常用英文NLP数据集
Stars: ✭ 2,112 (+3052.24%)
Mutual labels:  sentiment-analysis, chinese
Bulbea
🐗 🐻 Deep Learning based Python Library for Stock Market Prediction and Modelling
Stars: ✭ 1,585 (+2265.67%)
Mutual labels:  finance, sentiment-analysis
Nlp4han
中文自然语言处理工具集【断句/分词/词性标注/组块/句法分析/语义分析/NER/N元语法/HMM/代词消解/情感分析/拼写检查】
Stars: ✭ 206 (+207.46%)
Mutual labels:  sentiment-analysis, chinese
Finance Python
python tools for Finance with the functionality of indicator calculation, business day calculation and so on.
Stars: ✭ 238 (+255.22%)
Mutual labels:  finance, chinese
senticnetapi
Simple API to use SenticNet
Stars: ✭ 69 (+2.99%)
Mutual labels:  sentiment-analysis
PlanSum
[AAAI2021] Unsupervised Opinion Summarization with Content Planning
Stars: ✭ 25 (-62.69%)
Mutual labels:  sentiment-analysis
Scon-ABSA
[CIKM 2021] Enhancing Aspect-Based Sentiment Analysis with Supervised Contrastive Learning
Stars: ✭ 17 (-74.63%)
Mutual labels:  sentiment-analysis
FinanceTools
投资/财务相关的小工具
Stars: ✭ 19 (-71.64%)
Mutual labels:  finance
tellerbot
Telegram Bot for over-the-counter trading
Stars: ✭ 17 (-74.63%)
Mutual labels:  finance
twitter-aws-comprehend
An app to analyze tweets using Amazon Comprehend's Sentiment Analysis service
Stars: ✭ 13 (-80.6%)
Mutual labels:  sentiment-analysis
Sentiment-Analysis-facebook-comments
Detection and Prediction of Users Attitude Based on Real-Time and Batch Sentiment Analysis of Facebook Comments
Stars: ✭ 63 (-5.97%)
Mutual labels:  sentiment-analysis
akshare
AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库
Stars: ✭ 5,155 (+7594.03%)
Mutual labels:  finance
QuestionClustering
Clasificador de preguntas escrito en python 3 que fue implementado en el siguiente vídeo: https://youtu.be/qnlW1m6lPoY
Stars: ✭ 15 (-77.61%)
Mutual labels:  sentiment-analysis
VARBook
程序员的英语助手,输入中文,智能转换为英文变量
Stars: ✭ 24 (-64.18%)
Mutual labels:  chinese
FinMesh
A python package that brings together financial and economic data.
Stars: ✭ 20 (-70.15%)
Mutual labels:  finance
hfusion
Multimodal sentiment analysis using hierarchical fusion with context modeling
Stars: ✭ 42 (-37.31%)
Mutual labels:  sentiment-analysis
ODSQA
ODSQA: OPEN-DOMAIN SPOKEN QUESTION ANSWERING DATASET
Stars: ✭ 43 (-35.82%)
Mutual labels:  chinese
ir
Projeto de calculo de Imposto de Renda em operacoes na bovespa automaticamente. Tags:canal eletronico do investidor, CEI, selenium, bovespa, IRPF, IR, imposto de renda, finance, yahoo finance, acao, fii, etf, python, crawler, webscraping, calculadora ir
Stars: ✭ 120 (+79.1%)
Mutual labels:  finance

中文金融情感词典

本 GitHub 仓库上传了一款中文金融情感词典,该词典来自姜富伟、孟令超、唐国豪,“媒体文本情绪与股票回报预测”,《经济学(季刊)》,2021年第4期,第1323-1344页。在尊重知识产权的前提下,读者可以免费使用该词典,请引用下列文献:

  • Fuwei Jiang, Joshua Lee, Xiumin Martin, and Guofu Zhou.“Manager Sentiment and Stock Returns” Journal of Financial Economics 132(1), 2019,126-149
  • 姜富伟、孟令超、唐国豪,“媒体文本情绪与股票回报预测”,《经济学(季刊)》,2021年第4期,第1323-1344页。

词典构建方法

构建中文金融情感词典的两大素材是英文金融词典(LM词典)以及现有的中文通用情感词典,我们将把英文LM金融词典转化为对应的中文版本(洋为中用),并从中文通用情感词典中筛选出在金融语境下仍然适用的情感词汇(古为今用),这两部分词语是中文金融情感词典的重要组成部分。为了避免金融情感词语的遗漏,我们利用word2vec算法(一种深度学习算法)从语料中找到与前两部分词语高度相关并且具有合适情感倾向的词语,从而实现扩充词典的目的。最后,将上述三种方法得到的词语合并去除,得到最终的中文金融情感词典。在古为今用部分,为了避免不同通用情感词典之间特征差异的影响,同时也为了保证词语的完备性,我们将三个应用程度较为广泛的词典(知网HowNet情感词典、清华大军李军词典以及台湾大学NTUSD词典) 合并去重,以此作为所使用的通用情感词典。

中文金融情感词典构建方法

词典信息

完整词典共9228个词语,其中消极词语共5890词,积极词语共3338词。

消极词语部分 (5890)
来源 词语数量
LM词典中文翻译 1562
通用词典筛选 Tsinghua词典 1945
知网词典 534
NTUSD词典 1243
Word2vec词典扩充 606
积极词语部分 (3338)
来源 词语数量
LM词典中文翻译 458
通用词典筛选 Tsinghua词典 1928
知网词典 304
NTUSD词典 255
Word2vec词典扩充 393

词语示例

下表中展示了中文金融情感词典三个来源中的代表性词语。LM词典中文翻译中的词语多为金融领域的专有词汇,与金融相关极为密切,这部分词语在通用情感词典中是极为少见的。通用情感词典筛选得到的词语则多为日常语境中常见的情感词汇,这些词汇在金融语境下仍然出现概率较大,而且情感意义保持一致,因此也被纳入到金融情感词典中。word2vec词典扩充得到的词语则为前两部分词语的有力补充。与LM词典中文翻译词语相比,这一部分词语与金融语境也有很强的相关性,但是词语的口语化与习语化特征更为明显,而LM词典的翻译词语则相对更加正式。通过表中词语特征,我们可以看出,LM词典中文翻译、通用情感词典筛选与word2vec词典扩充三部分词语特征差别较大,它们互为补充,共同构成了一个完善的中文金融情感词典。

词语倾向 来源 词语 词语倾向 来源 词语
负向词语 LM词典中文翻译 正向词语 LM词典中文翻译
被降级的 晋升
管理不善 先发优势
旷工 独家经营
漏税 超额完成
通用情感词典筛选 诽谤 通用情感词典筛选 一帆风顺
担心 井然有序
艰苦 可靠的
薄弱 合法的
惩罚 完美
Word2vec词典扩充 败下阵来 Word2vec词典扩充 爱岗敬业
变相涨价 大好时机
操作失误 高回报
炒鱿鱼 绝对优势
大跌眼镜 可喜成绩

更多细节请参见论文:姜富伟、孟令超、唐国豪,“媒体文本情绪与股票回报预测”,《经济学(季刊)》,2021年第4期,第1323-1344页。.

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].