All Projects → papyrussolution → Uhttbarcodereference

papyrussolution / Uhttbarcodereference

Universe-HTT barcode reference

Projects that are alternatives of or similar to Uhttbarcodereference

Covid 19 Uk Data
Coronavirus (COVID-19) UK Historical Data
Stars: ✭ 169 (-73.34%)
Mutual labels:  csv, dataset
Openml R
R package to interface with OpenML
Stars: ✭ 81 (-87.22%)
Mutual labels:  opendata, dataset
Tech.ml.dataset
A Clojure high performance data processing system
Stars: ✭ 205 (-67.67%)
Mutual labels:  csv, dataset
Universal Data Tool
Collaborate & label any type of data, images, text, or documents, in an easy web interface or desktop app.
Stars: ✭ 1,356 (+113.88%)
Mutual labels:  csv, dataset
municipios-br
Dados em formato aberto sobre municípios e unidades federativas do Brasil.
Stars: ✭ 58 (-90.85%)
Mutual labels:  csv, opendata
Iso 3166 Countries With Regional Codes
ISO 3166-1 country lists merged with their UN Geoscheme regional codes in ready-to-use JSON, XML, CSV data sets
Stars: ✭ 1,372 (+116.4%)
Mutual labels:  csv, dataset
Qri
you're invited to a data party!
Stars: ✭ 1,003 (+58.2%)
Mutual labels:  opendata, dataset
Kalulu
Uganda Elections Tools and Resources
Stars: ✭ 24 (-96.21%)
Mutual labels:  opendata, csv
Pynasa
Stars: ✭ 212 (-66.56%)
Mutual labels:  opendata, dataset
Awesome Italian Public Datasets
A selection of interesting Open dataset from the Italian Public Administration and Civic Data use cases
Stars: ✭ 132 (-79.18%)
Mutual labels:  opendata, dataset
Csvpack
csvpack library / gem - tools 'n' scripts for working with tabular data packages using comma-separated values (CSV) datafiles in text with meta info (that is, schema, datatypes, ..) in datapackage.json; download, read into and query CSV datafiles with your SQL database (e.g. SQLite, PostgreSQL, ...) of choice and much more
Stars: ✭ 71 (-88.8%)
Mutual labels:  csv, dataset
awesome-csv
Awesome Comma-Separated Values (CSV) - What's Next? - Frequently Asked Questions (F.A.Q.s) - Libraries & Tools
Stars: ✭ 46 (-92.74%)
Mutual labels:  csv, opendata
Fifa Fut Data
Web-scraping script that writes the data of all players from FutHead and FutBin to a CSV file or a DB
Stars: ✭ 55 (-91.32%)
Mutual labels:  csv, dataset
Weihanli.npoi
NPOI Extensions, excel/csv importer/exporter for IEnumerable<T>/DataTable, fluentapi(great flexibility)/attribute configuration
Stars: ✭ 157 (-75.24%)
Mutual labels:  csv, dataset
England
Football data for England (and Wales) incl. English Premier League, The Football League (Championship, League One, League Two), Football Conference etc.
Stars: ✭ 117 (-81.55%)
Mutual labels:  opendata, csv
gems
Ruby Football Week 2021, June 11th to June 17th - 7 Days of Ruby (Sports) Gems ++ Best of Ruby Gems Series
Stars: ✭ 76 (-88.01%)
Mutual labels:  csv, opendata
Visidata
A terminal spreadsheet multitool for discovering and arranging data
Stars: ✭ 4,606 (+626.5%)
Mutual labels:  opendata, csv
Open stt
Open STT
Stars: ✭ 584 (-7.89%)
Mutual labels:  dataset
Label Studio
Label Studio is a multi-type data labeling and annotation tool with standardized output format
Stars: ✭ 7,264 (+1045.74%)
Mutual labels:  dataset
Laracsv
A Laravel package to easily generate CSV files from Eloquent model
Stars: ✭ 583 (-8.04%)
Mutual labels:  csv

UhttBarcodeReference

Universe-HTT barcode reference

Universe-HTT

Компания Петроглиф

OpenPapyrus

Самый большой и аккуратный открытый справочник штрихкодов в интернете! Если не верите - поисковики помогут развеять сомнения. Более 4.7 миллионов штрихкодов стандартов ean13,ean8,upc-e,upc-a с соответствующими наименованиями, брэндами и категориями.

Кроме прочего, база данных включает в себя все валидные штрихкоды, представленные в базе данных USDA Food Composition Databases (по состоянию на август 2018 года).

Оригинал справочника находится на сервере Universe-HTT - здесь мы размещаем его копию, содержащую следующие поля:

  • (ID) Идентификатор товара в базе данных Universe-HTT
  • (UPCEAN) Штрихкод
  • (Name) Наименование товара
  • (CategoryID) Идентификатор категории в базе данных Universe-HTT
  • (CategoryName) Наименование категории
  • (BrandID) Идентификатор брэнда в базе данных Universe-HTT
  • (BrandName) Наименование брэнда

Данные представлены в текстовом формате в кодировке UTF-8 с символом табуляции (0x09) в качестве разделителя полей.

При формировании этого справочника из оригинала извлекаются только валидные UPC/EAN штрихкоды. Таким образом, все штрихкоды в этом репозитории гарантированно соответствуют указанным стандартам (что не исключает некоторых иных проблем). Кроме того, штрихкоды EAN13 с ведущей цифрой 2 (приватные коды) практически отсутствуют (без гарантии).

Репозиторий в каталоге DATA содержит данные, разбитые на фрагменты (примерно по 1Мб каждый). Полный файл, упакованный в формате 7z, находится в релизах.

Дополнительные файлы:

  • uhtt_barcode_ref_stat.txt - статистика: общее количество штрихкодов (barcode-count), количество брэндов (brand-count), количество категорий (categ-count), количество слов (word-count)
  • uhtt_barcode_ref_brand_concord.csv - список брэндов с количеством штрихкодов, соответствующих каждому. Отсортированы по наименованию.
  • uhtt_barcode_ref_category_concord.csv - список категорий с количеством штрихкодов, соответствующих каждой. Отсортированы по наименовани.
  • uhtt_barcode_ref_word_concord_bytext.csv - список слов из наименований товаров с частотой по всей выборке. Отсортированы в лексикографическом порядке.
  • uhtt_barcode_ref_word_concord_byfreq.csv - список слов из наименований товаров с частотой по всей выборке. Отсортированы по частоте.

В качестве благодарности, вы можете отметить звездочкой этот репозиторий, а так же репозиторий OpenPapyrus поскольку именно эту великолепную ERP-систему мы используем для администрирования, обработки и обеспечения доступа к данным справочника через портал Universe-HTT.


The largest and most accurate open reference book of bar codes on the Internet! If you do not believe it, the search engines will help dispel doubts. Over 4.7 million bar codes of ean13, ean8, upc-e, upc-a standards with corresponding names, brands and categories.

Among other things, the database includes all valid barcodes presented in the USDA Food Composition Databases (as of August 2018).

The original directory is located on the Universe-HTT server - here we place its copy containing the following fields:

  • (ID) The identifier of the goods in the Universe-HTT database
  • (UPCEAN) Barcode
  • (Name) Product name
  • (CategoryID) Category ID in the Universe-HTT database
  • (CategoryName) Category name
  • (BrandID) Brand identifier in the Universe-HTT database
  • (BrandName) Brand name

Data is presented in text format in UTF-8 encoding with a tab (0x09) as a field separator.

When creating this directory, only valid UPC / EAN barcodes are extracted from the original. Thus, all barcodes in this repository are guaranteed to meet the specified standards (which does not exclude some other problems). In addition, bar codes EAN13 with leading digit 2 (private codes) are practically absent (without warranty).

The repository in the DATA directory contains data broken into fragments (approximately 1MB each). The complete file, packed in 7z format, is in releases.

Additional files:

  • uhtt_barcode_ref_stat.txt - statistics: the total number of bar codes (barcode-count), the number of brands (brand-count), the number of categories (categ-count), the number of words (word-count)
  • uhtt_barcode_ref_brand_concord.csv - a list of brands with the number of bar codes corresponding to each. Sorted by name.
  • uhtt_barcode_ref_category_concord.csv - a list of categories with the number of bar codes corresponding to each. Sorted by name.
  • uhtt_barcode_ref_word_concord_bytext.csv - a list of words from product names with a frequency across the entire sample. Sorted out in lexicographical order.
  • uhtt_barcode_ref_word_concord_byfreq.csv - a list of words from product names with a frequency across the entire sample. Sorted by frequency.

As gratitude, you can mark this repository with an asterisk, as well as the OpenPapyrus repository, since we use this excellent ERP-system for administration, processing and access to the directory data through the portal Universe-HTT.

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].