All Projects → gilek → Sphinx Polish Wordforms

gilek / Sphinx Polish Wordforms

Słownik polskich odmian dla Sphinx

Labels

Projects that are alternatives of or similar to Sphinx Polish Wordforms

sphinx-immaterial
Adaptation of the popular mkdocs-material material design theme to the sphinx documentation system
Stars: ✭ 43 (+437.5%)
Mutual labels:  sphinx
Sphinx
Main repository for the Sphinx documentation builder
Stars: ✭ 4,313 (+53812.5%)
Mutual labels:  sphinx
Readthedocs.org
The source code that powers readthedocs.org
Stars: ✭ 6,802 (+84925%)
Mutual labels:  sphinx
Sphinx-Beryllium
Sphinx Custom Kernel for Pocophone F1 (Beryllium)
Stars: ✭ 23 (+187.5%)
Mutual labels:  sphinx
Furo
A clean customizable documentation theme for Sphinx
Stars: ✭ 267 (+3237.5%)
Mutual labels:  sphinx
Docs
MinIO Object Storage Documentation
Stars: ✭ 488 (+6000%)
Mutual labels:  sphinx
php-sphinx-search
Sphinx for PHP 5.3 and above. Fully PHPUnit tested.
Stars: ✭ 19 (+137.5%)
Mutual labels:  sphinx
React Express Fullstack
Full stack (mostly unopinionated) starter pack with React+Redux and Expressjs
Stars: ✭ 23 (+187.5%)
Mutual labels:  sphinx
Doc2dash
Create docsets for Dash.app-compatible API browser.
Stars: ✭ 380 (+4650%)
Mutual labels:  sphinx
Awesome Sphinxdoc
A curated list of awesome tools for Sphinx Python Documentation Generator
Stars: ✭ 716 (+8850%)
Mutual labels:  sphinx
docs-italia-theme
Tema per i documenti pubblicati su Docs Italia
Stars: ✭ 15 (+87.5%)
Mutual labels:  sphinx
Documentation
📘 Nextcloud documentation
Stars: ✭ 268 (+3250%)
Mutual labels:  sphinx
Breathe
ReStructuredText and Sphinx bridge to Doxygen
Stars: ✭ 514 (+6325%)
Mutual labels:  sphinx
sphinx-theme
(Deprecated) Make Sphinx docs look like MDN
Stars: ✭ 27 (+237.5%)
Mutual labels:  sphinx
Javersphinxbundle
Symfony bundle which provides integration of Sphinx search engine with Symfony using SphinxQL
Stars: ✭ 18 (+125%)
Mutual labels:  sphinx
VoiceCom
A Simple Voice Command Application powered by Java and Sphinx4 Speech Recognition Library
Stars: ✭ 17 (+112.5%)
Mutual labels:  sphinx
Easyavr
Easy AVR USB Keyboard Firmware and Keymapper
Stars: ✭ 479 (+5887.5%)
Mutual labels:  sphinx
Jsx Lexer
a JSX lexer for pygments
Stars: ✭ 26 (+225%)
Mutual labels:  sphinx
Sphinxcontrib Asyncio
Sphinx extension to add asyncio-specific markups
Stars: ✭ 19 (+137.5%)
Mutual labels:  sphinx
Nzedb
nZEDb - a fork of nnplus(2011) | NNTP / Usenet / Newsgroup indexer.
Stars: ✭ 556 (+6850%)
Mutual labels:  sphinx

sphinx-polish-wordforms

Polski język trudna język. Na obecną chwilę Sphinx (wersja 2.2.9) nie oferuje żadnego lematyzatora oraz stemmera dla języka polskiego. Sytuacja pewnie szybko się nie zmieni, zatem jesteśmy zmuszeni korzystać z pliku wordforms.

Słownik stworzony został w oparciu o plik sjp-odm-20141029.zip. Pomysł na jego wykorzystanie zaczerpnąłem z bloga allegro.

Plik zawiera wyrazy o długości przynajmniej 2 znaków. Nieistotna jest wielkość liter, a znaki diakrytyczne są usuwane. Ignorowane są również znaki: {-,-, ., '}.

Konfiguracja indeksu powinna wyglądnąć z następujący sposób:

charset_table 	= 0..9, A..Z->a..z, a..z, \
	U+104->a, U+106->c, U+118->e, U+141->l, U+143->n, \
	U+0D3->o, U+15A->s, U+179->z, U+17B->z, U+105->a, \
	U+107->c, U+119->e, U+142->l, U+144->n, U+0F3->o, \
	U+15B->s, U+17A->z, U+17C->z, \
	U+00E9->e, U+00EB->e, U+00FC->u, U+00F6->o # é, ë, ü, ö
min_word_len	= 2
ignore_chars	= U+002D, U+FF0D, U+002E, U+0027 # -, -, . , '
stopwords		= stopwords.txt
wordforms		= wordlist.txt
Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].