All Projects → dkulagin → Kartaslov

dkulagin / Kartaslov

Labels

Projects that are alternatives of or similar to Kartaslov

ck-env
CK repository with components and automation actions to enable portable workflows across diverse platforms including Linux, Windows, MacOS and Android. It includes software detection plugins and meta packages (code, data sets, models, scripts, etc) with the possibility of multiple versions to co-exist in a user or system environment:
Stars: ✭ 67 (-75.19%)
Mutual labels:  datasets
podium
Podium: a framework agnostic Python NLP library for data loading and preprocessing
Stars: ✭ 55 (-79.63%)
Mutual labels:  datasets
datasets
TFDS data loaders for sign language datasets.
Stars: ✭ 17 (-93.7%)
Mutual labels:  datasets
opendatasets
A Python library for downloading datasets from Kaggle, Google Drive, and other online sources.
Stars: ✭ 161 (-40.37%)
Mutual labels:  datasets
TSForecasting
This repository contains the implementations related to the experiments of a set of publicly available datasets that are used in the time series forecasting research space.
Stars: ✭ 53 (-80.37%)
Mutual labels:  datasets
databrewer-recipes
DataBrewer Recipes Repository.
Stars: ✭ 19 (-92.96%)
Mutual labels:  datasets
SER-datasets
A collection of datasets for the purpose of emotion recognition/detection in speech.
Stars: ✭ 74 (-72.59%)
Mutual labels:  datasets
Roapi
Create full-fledged APIs for static datasets without writing a single line of code.
Stars: ✭ 253 (-6.3%)
Mutual labels:  datasets
disent
🧶 Modular VAE disentanglement framework for python built with PyTorch Lightning ▸ Including metrics and datasets ▸ With strongly supervised, weakly supervised and unsupervised methods ▸ Easily configured and run with Hydra config ▸ Inspired by disentanglement_lib
Stars: ✭ 41 (-84.81%)
Mutual labels:  datasets
Writing-editing-Network
Code for Paper Abstract Writing through Editing Mechanism
Stars: ✭ 72 (-73.33%)
Mutual labels:  datasets
ml4se
A curated list of papers, theses, datasets, and tools related to the application of Machine Learning for Software Engineering
Stars: ✭ 46 (-82.96%)
Mutual labels:  datasets
dplace-data
The data repository for the D-PLACE Project (Database of Places, Language, Culture and Environment)
Stars: ✭ 49 (-81.85%)
Mutual labels:  datasets
NetEmb-Datasets
A collection of real-world networks/graphs for Network Embedding
Stars: ✭ 18 (-93.33%)
Mutual labels:  datasets
databrewer
The missing datasets manager. Like hombrew but for datasets. CLI-tool for search and discover datasets!
Stars: ✭ 39 (-85.56%)
Mutual labels:  datasets
newsletter-archive
Markdown archive & RSS/Atom feeds for Data Is Plural.
Stars: ✭ 65 (-75.93%)
Mutual labels:  datasets
RData.jl
Read R data files from Julia
Stars: ✭ 49 (-81.85%)
Mutual labels:  datasets
recurrent-defocus-deblurring-synth-dual-pixel
Reference github repository for the paper "Learning to Reduce Defocus Blur by Realistically Modeling Dual-Pixel Data". We propose a procedure to generate realistic DP data synthetically. Our synthesis approach mimics the optical image formation found on DP sensors and can be applied to virtual scenes rendered with standard computer software. Lev…
Stars: ✭ 30 (-88.89%)
Mutual labels:  datasets
Hub
Dataset format for AI. Build, manage, & visualize datasets for deep learning. Stream data real-time to PyTorch/TensorFlow & version-control it. https://activeloop.ai
Stars: ✭ 4,003 (+1382.59%)
Mutual labels:  datasets
dbcollection
A collection of popular datasets for deep learning.
Stars: ✭ 26 (-90.37%)
Mutual labels:  datasets
covid-19-data-cleanup
Scripts to cleanup data from https://github.com/CSSEGISandData/COVID-19
Stars: ✭ 25 (-90.74%)
Mutual labels:  datasets

Открытые данные на Карте слов

Карта слов — это онлайн-тезаурус русского языка, в котором каждый пользователь Рунета может найти ассоциации, синонимы, посмотреть контекстные связи и примеры предложений к словам и выражениям русского языка.

При создании сайта мы работаем с огромным количеством лингвистических данных. Некоторые датасеты показались нам довольно интересными и мы хотим поделиться ими с сообществом.

Датасеты

  • Открытая семантика русского языка — разметка слов и выражений русского языка по семантическим срезам («люди», «животные», «сооружения», «вещи», «действия» и т.д.).

  • Тональный словарь русского языка — слова и выражения русского языка, размеченные по полярности (положительная, отрицательная, нейтральная). Также приводится сила выраженности эмоционально-оценочного заряда.

  • Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.

  • Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.

Интерактивный навигатор

Для удобства работы с датасетами мы разработали интерактивный навигатор, в котором можно изучить данные без необходимости скачивать их на локальный компьютер. На данный момент в нём представлена только открытая семантика и тональный словарь, но по мере обновления датасетов будут добавлены и другие наборы.

Контакты

Связаться с нами можно по электронной почте: [email protected]

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].