All Projects → notesjor → corpusexplorer2.0

notesjor / corpusexplorer2.0

Licence: AGPL-3.0 license
Korpuslinguistik war noch nie so einfach...

Programming Languages

C#
18002 projects
Rich Text Format
576 projects
Vue
7211 projects
smalltalk
420 projects
javascript
184084 projects - #8 most used programming language
SCSS
7915 projects

Projects that are alternatives of or similar to corpusexplorer2.0

Artificial Adversary
🗣️ Tool to generate adversarial text examples and test machine learning models against them
Stars: ✭ 348 (+2075%)
Mutual labels:  text-mining, data-mining, text-analysis, text-processing
teanaps
자연어 처리와 텍스트 분석을 위한 오픈소스 파이썬 라이브러리 입니다.
Stars: ✭ 91 (+468.75%)
Mutual labels:  text-mining, data-mining, text-processing
Xioc
Extract indicators of compromise from text, including "escaped" ones.
Stars: ✭ 148 (+825%)
Mutual labels:  text-mining, data-mining, text-processing
advanced-text-mining
TEANAPS 라이브러리를 활용한 자연어 처리와 텍스트 분석 방법론에 대해 다룹니다.
Stars: ✭ 15 (-6.25%)
Mutual labels:  text-mining, data-mining, text-processing
Cogcomp Nlpy
CogComp's light-weight Python NLP annotators
Stars: ✭ 115 (+618.75%)
Mutual labels:  text-mining, data-mining, text-processing
iis
Information Inference Service of the OpenAIRE system
Stars: ✭ 16 (+0%)
Mutual labels:  text-mining, data-mining, big-data
TextDatasetCleaner
🔬 Очистка датасетов от мусора (нормализация, препроцессинг)
Stars: ✭ 27 (+68.75%)
Mutual labels:  text-mining, linguistics, text-processing
TRUNAJOD2.0
An easy-to-use library to extract indices from texts.
Stars: ✭ 18 (+12.5%)
Mutual labels:  text-mining, text-analysis, text-processing
text-analysis
Weaving analytical stories from text data
Stars: ✭ 12 (-25%)
Mutual labels:  text-mining, text-analysis, text-processing
Graphbrain
Language, Knowledge, Cognition
Stars: ✭ 294 (+1737.5%)
Mutual labels:  text-mining, text-analysis, natural-language-understanding
support-tickets-classification
This case study shows how to create a model for text analysis and classification and deploy it as a web service in Azure cloud in order to automatically classify support tickets. This project is a proof of concept made by Microsoft (Commercial Software Engineering team) in collaboration with Endava http://endava.com/en
Stars: ✭ 142 (+787.5%)
Mutual labels:  text-mining, text-analysis, text-processing
Open Semantic Search
Open Source research tool to search, browse, analyze and explore large document collections by Semantic Search Engine and Open Source Text Mining & Text Analytics platform (Integrates ETL for document processing, OCR for images & PDF, named entity recognition for persons, organizations & locations, metadata management by thesaurus & ontologies, search user interface & search apps for fulltext search, faceted search & knowledge graph)
Stars: ✭ 386 (+2312.5%)
Mutual labels:  text-mining, text-analysis, journalism
Text mining resources
Resources for learning about Text Mining and Natural Language Processing
Stars: ✭ 358 (+2137.5%)
Mutual labels:  text-mining, data-mining, text-analysis
perke
A keyphrase extractor for Persian
Stars: ✭ 60 (+275%)
Mutual labels:  text-mining, data-mining, text-processing
R Text Data
List of textual data sources to be used for text mining in R
Stars: ✭ 85 (+431.25%)
Mutual labels:  text-mining, text-analysis
Textcluster
短文本聚类预处理模块 Short text cluster
Stars: ✭ 115 (+618.75%)
Mutual labels:  text-mining, text-processing
Orange3 Text
🍊 📄 Text Mining add-on for Orange3
Stars: ✭ 83 (+418.75%)
Mutual labels:  text-mining, text-analysis
Awesome Hungarian Nlp
A curated list of NLP resources for Hungarian
Stars: ✭ 121 (+656.25%)
Mutual labels:  text-mining, natural-language-understanding
Qdap
Quantitative Discourse Analysis Package: Bridging the gap between qualitative data and quantitative analysis
Stars: ✭ 146 (+812.5%)
Mutual labels:  text-mining, text-analysis
Pyss3
A Python package implementing a new machine learning model for text classification with visualization tools for Explainable AI
Stars: ✭ 191 (+1093.75%)
Mutual labels:  text-mining, data-mining

CorpusExplorer2.0

Software für Korpuslinguist*innen und Text-/Data-Mining Interessierte. Der CorpusExplorer vereint über 45 interaktiven Auswertungsmöglichkeiten mit einer einfachen Bedienung. Routineaufgaben wie z. B. Textakquise, Taggen oder die grafische Aufbereitung von Ergebnissen werden vollständig automatisiert. Die einfache Handhabung erleichtert den Einsatz in der universitären Lehre und führt zu schnellen sowie gehaltvollen Ergebnissen. Dabei ist der CorpusExplorer offen für viele Standards (XML, CSV, JSON, R, uvm.) und bietet darüber hinaus ein eigenes Software Development Kit (SDK) an, mit dem es möglich ist, alle Funktionen in eigene Programme zu integrieren.

Key Features

  • Unterstützt über 100 unterschiedliche Datei-/Textformate für Im-/Export - inkl. vieler linguistischer XML-Formate.
  • Integrierter Webcrawler zum Sammeln eigener Webkorpora.
  • Sehr einfache Programmoberfläche / Korpus mit wenigen Mausklicks automatisch bereinigen und annotieren - direkt analysefertig.
  • Anbindung unterschiedlicher Tagger - z. B. TreeTagger, OpenNLP, Stanford POS, uvm.
  • Erlaubt Analyse unterschiedlichster Quellen - z. B. Transkripte, Zeitungsartikel, PDF, E-Mails, Tweets, Webseiten, eBooks, uvm.
  • Im Hintergrund arbeitet eine sehr schnelle In-Memory Datenbank - speziell für die Korpusanalyse entwickelt. Diese Datenbank kann gegen verschiedene SQL- (MySQL, SQLite) und NoSQL-Datenbanken (ElasticSearch) ausgetauscht werden.
  • Unbegrenzte Korpusgröße - Verteilte Verarbeitung möglich.
  • Über 45 Visualisierungen - z. B.: Frequenzanalyse, N-Gramme, Phrasen, Kookkurrenzen, KWIC, DIFF, Stilmetriken, Korpusverteilung.
  • Auswertungen/Visualisierungen werden vom Ausgangsmaterial/Korpora vollständig durch Schnappschüsse isoliert. Dadurch sind Ergebnisse reproduzierbar, selbst wenn sich das Korpusmaterial ändert.
  • Per Shell/Konsole steuerbar (siehe https://github.com/notesjor/CorpusExplorer.Terminal.Console). Dies ist eine gute Anlaufstelle, wenn Sie den CorpusExplorer in eigene Skripte (R, python, etc.) integrieren möchten.
  • Flexibles SDK (Software Development Kit) für alle .NET-Sprachen (https://de.wikipedia.org/wiki/Liste_von_.NET-Sprachen). Erlaubt eigene Erweiterungen für den CorpusExplorer zu entwickeln oder den CorpusExplorer in eigene Anwendungen zu integrieren.

Systemvoraussetzungen:

Download / Handbuch / Video-Anleitung / Erweiterungen

http://www.corpusexplorer.de

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].