All Projects → nsu-ai → soroka

nsu-ai / soroka

Licence: Apache-2.0 license
Узнай, хорошо или плохо говорят о тебе или твоей фирме в Интернете! Наша "Сорока" с искусственным интеллектом принесёт тебе это на своём хвосте.

Programming Languages

python
139335 projects - #7 most used programming language

Projects that are alternatives of or similar to soroka

sentiment.datalogue
Sentiment analysis challenge for Datalogue recruiting
Stars: ✭ 14 (-12.5%)
Mutual labels:  sentiment-analysis
GroupDocs.Classification-for-.NET
GroupDocs.Classification-for-.NET samples and showcase (text and documents classification and sentiment analysis)
Stars: ✭ 38 (+137.5%)
Mutual labels:  sentiment-analysis
TLA
A comprehensive tool for linguistic analysis of communities
Stars: ✭ 47 (+193.75%)
Mutual labels:  sentiment-analysis
sentiment-analysis-webapp
[不再更新]中文短文本情感分析 web 应用 | A web app about Chinese sentences sentiment analysis
Stars: ✭ 33 (+106.25%)
Mutual labels:  sentiment-analysis
wink-nlp
Developer friendly Natural Language Processing ✨
Stars: ✭ 312 (+1850%)
Mutual labels:  sentiment-analysis
DeepLearning-PadhAI
All the code files related to the deep learning course from PadhAI
Stars: ✭ 88 (+450%)
Mutual labels:  cnn-classification
LSTM-sentiment-analysis
LSTM sentiment analysis. Please look at my another repo for SVM and Naive algorithem
Stars: ✭ 19 (+18.75%)
Mutual labels:  sentiment-analysis
twitter-sentiment-analysis
Streaming tweets with spark, language detection & sentiment analysis, dashboard with Kibana
Stars: ✭ 100 (+525%)
Mutual labels:  sentiment-analysis
sentiment-analysis-using-python
Large Data Analysis Course Project
Stars: ✭ 23 (+43.75%)
Mutual labels:  sentiment-analysis
awesome-text-classification
Text classification meets word embeddings.
Stars: ✭ 27 (+68.75%)
Mutual labels:  sentiment-analysis
stansent
No description or website provided.
Stars: ✭ 16 (+0%)
Mutual labels:  sentiment-analysis
node-alchemy
An Alchemy API library for Node.JS
Stars: ✭ 54 (+237.5%)
Mutual labels:  sentiment-analysis
arabic-sentiment-analysis
Sentiment Analysis in Arabic tweets
Stars: ✭ 64 (+300%)
Mutual labels:  sentiment-analysis
sentiment-analysis2
Sentiment ananlysis in keras and mxnet
Stars: ✭ 37 (+131.25%)
Mutual labels:  sentiment-analysis
sentimentAnalysisLab
This lab is about how to add the AI and ML cloud service feature to your web application with React and the Amplify Framework.
Stars: ✭ 78 (+387.5%)
Mutual labels:  sentiment-analysis
pysentimiento
A Python multilingual toolkit for Sentiment Analysis and Social NLP tasks
Stars: ✭ 274 (+1612.5%)
Mutual labels:  sentiment-analysis
sarcasm-detection-for-sentiment-analysis
Sarcasm Detection for Sentiment Analysis
Stars: ✭ 21 (+31.25%)
Mutual labels:  sentiment-analysis
pandas twitter
Analyzing Trump's tweets using Python (Pandas + Twitter workshop)
Stars: ✭ 81 (+406.25%)
Mutual labels:  sentiment-analysis
Emotion and Polarity SO
An emotion classifier of text containing technical content from the SE domain
Stars: ✭ 74 (+362.5%)
Mutual labels:  sentiment-analysis
tf-sentiment-docker
A docker image for sentiment analysis on tensorflow
Stars: ✭ 15 (-6.25%)
Mutual labels:  sentiment-analysis

Soroka

Узнай, хорошо или плохо говорят о тебе или твоей фирме в Интернете! Наша "Сорока" с искусственным интеллектом принесёт тебе это на своём хвосте.

“Soroka” – нейросетевой продукт, анализирующий репутацию человека или компании в Интернете.

Для этого вам нужно указать название компании (или имя человека), а также один или несколько интернет-адресов, с которых начнётся анализ веб-контента. Затем с помощью свёрточных нейронных сетей система ищет упоминания заданного имени или названия, после чего анализирует тональность контекста. В результате вы получаете коэффициент сороки – долю положительных, негативных и нейтральных упоминаний в тексте по заданному объекту на заданном сайте (группе сайтов).

“Soroka” поможет вам следить за своей собственной репутацией и репутацией вашей компании, первым узнавать о значимых тенденциях в общественном мнении и вовремя реагировать на любые изменения.

Как это работает:

В нашем продукте мы используем свёрточные нейронные сети, концепция которых успешно используется для анализа изображений. В последнее время этот подход приобрел популярность в задачах обработки естественного языка. Существует ряд публикаций, доказывающих их преимущества перед другими алгоритмами: например, качество свёрточной сети сравнимо с качеством рекуррентной сети типа LSTM или GRU, при этом время обучения свёрточной нейросети меньше в несколько раз.

Также мы использовали двухслойный персептрон в рамках модели word2vec для решения вспомогательной задачи – формирования векторов слов, которые используются как признаки для свёрточной нейросети.

На первом шаге веб-краулер парсит заданный сайт, от странички к страничке переходя вплоть до установленного уровня вложенности и выкачивая весь текстовый контент.

На втором шаге свёрточная нейронная сеть анализирует полученный текст и находит в нем упоминание о заданном человеке или организации.

На третьем шаге другая свёрточная нейросеть оценивает текст на его семантику и распознает эмоциональность текста – похвалу, критику, нейтральное мнение. В результате “Soroka” возвращает в процентном соотношении уровень положительных, негативных и нейтральных упоминаний искомого объекта в тексте.

Какие бизнес-задачи можно решать:

  • Сравнить, насколько хорошо или плохо пишут о вас и ваших конкурентах;

  • Оценить, как изменилось отношение к вам или вашей организации в Интернете после проведения рекламной кампании;

  • Узнать, что пишут о компаниях, акциями и облигациями которых вы владеете или собираетесь приобретать;

  • Оценить, что пишут о компании, услугами или продуктами которой вы хотите воспользоваться;

  • Провести анализ рынков с целью выявления потенциальных конкурентных преимуществ;

  • Оперативно реагировать на негативную реакцию о вас или вашей компании в Интернете;

  • И любые другие бизнес-кейсы, в которых требуется анализ тональности текста.

Установка и использование

Перед использованием убедитесь, что у вас установлен Python 3.x (мы использовали версию Python 3.6), и что все пакеты, перечисленные в файле requirements.txt, установлены в вашем Python-окружении. Кроме того, требуется скачать предобученную модель spacy xx_ent_wiki_sm. Сделать это можно с помощью команды:

python3 -m spacy download xx_ent_wiki_sm

Кроме того, один из компонентов системы использует векторные модели слов (word2vec), созданные в рамках проекта Russian Distributional Thesaurus https://nlpub.ru/Russian_Distributional_Thesaurus. Общий объём памяти, занимаемый этими векторами слов, составляет около половины гигабайта, поэтому мы не стали включать вектора слов в репозиторий. Но их можно выкачать, выполнив следующую команду из корневой директории проекта:

PYTHONPATH=$PWD python feature_extractors/embedding_extractor.py -d small

“Soroka” доступна для использования с помощью интерфейса командной строки. Вам нужно перейти в корневую директорию проекта и запустить Python-скрипт demo.py, в аргументах командной строки указав имя/название объекта для поиска, тип (сущность) этого объекта (человек person или организация organization) и ссылки на интересующие вас интернет-сайты, с которых должен начаться поиск.

К примеру, поиск информации о Сергее Шнурове на lenta.ru в рубрике о культуре выглядел бы так:

python -u demo.py --name "Сергей Шнуров" --who person --url https://lenta.ru/rubrics/culture/

Поиск информации об организации “Soroka” на сайте vk.com выглядит так:

python -u demo.py --name "Soroka" --who organization --url https://vk.com/

На выход модель выдаст следующие данные:

  • Сколько раз на сайте упоминается искомый объект;
  • “Коэффициент сороки”, т.е. какая доля упоминаний приходится на позитивные/негативные/нейтральные высказывания;
  • Итоговое “мнение сороки”, хорошо или плохо говорят о человеке/фирме в интернете.

Проект создан командой nsu_ai специально для хакатона neurohive.io

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].