FeedCrawler
FeedCrawler automatisiert bequem das Hinzufügen von Links für den JDownloader.
Installation
Voraussetzungen
- Python 3.6 oder neuer
- JDownloader 2 mit My JDownloader-Konto
- FlareSolverr ab v.2.0.0 um Cloudflare-Blockaden zu umgehen (optional)
Lokaler Build
Benötigt Node.js, npm und pip:
- Frontend-Pfad aufrufen:
cd feedcrawler/web_interface/vuejs_frontend
- Dependencies installieren:
npm ci
- Vue.js 3 Frontend kompilieren:
npm run build
- Zurück in das Hauptverzeichnis wechseln:
cd ../../..
- FeedCrawler auf Basis der setup.py installieren:
pip install .
pip
Installieren
pip install feedcrawler
Hinweise zur manuellen Installation und Einrichtung finden sich im Wiki!
Update
pip install -U feedcrawler
Starten
feedcrawler
in der Konsole (Python muss im System-PATH hinterlegt sein)
Docker Image
- Der Betrieb als Docker-Container empfiehlt sich als Standardinstallation - vor allem für NAS-Systeme, Homeserver und sonstige Geräte die dauerhaft und möglichst wartungsfrei (headless) betrieben werden sollen.
- Bei jedem Release wird ein getaggtes Image erstellt. Damit kann man auf der Wunschversion verbleiben oder im Falle eines Bugs zu einer stabilen Version zurück kehren.
- Um immer auf dem aktuellen Stand zu sein, einfach das mit
latest
getaggte Image nutzen. - Für UNRAID-Server kann das Image direkt über die Community Applications bezogen und der Container so eingerichtet werden.
Windows Exe
- Jedem Release wird eine selbstständig unter Windows lauffähige Version des FeedCrawlers beigefügt.
- Hierfür müssen weder Python, noch die Zusatzpakete installiert werden.
- Einfach die jeweilige Exe herunterladen und ausführen bzw. bei Updates die Exe ersetzen.
Hostnamen festlegen
FeedCrawler kann zum durchsuchen beliebiger Webseiten verwendet werden. Ausschließlich der Anwender entscheidet, welche Seiten durchsucht werden sollen. Diese Entscheidung trifft der Anwender selbstständig, indem er die FeedCrawler.ini in der Kategorie [Hostnames] manuell befüllt (ab = xyz.com). Eingetragen werden dort reine Hostnamen (ohne https://).
Dabei gilt
- Welcher Hostname aufgerufen wird entscheidet allein der Anwender.
- Ist nicht mindestens ein Hostname gesetzt, wird der FeedCrawler nicht starten.
- Passt die aufgerufene Seite hinter dem jeweiligen Hostnamen nicht zum Suchmuster des FeedCrawlers, kann es zu Fehlern kommen.
- Weder FeedCrawler noch der Autor benennen oder befürworten spezifische Hostnamen. Fragen hierzu werden ignoriert!
Startparameter
Parameter | Erläuterung |
---|---|
--log-level=<LOGLEVEL> |
Legt fest, wie genau geloggt wird (CRITICAL , ERROR , WARNING , INFO , DEBUG , NOTSET ) |
--config="<PFAD>" |
Legt den Ablageort für Einstellungen und Logs fest |
--port=<PORT> |
Legt den Port des Webservers fest |
--jd-user=<NUTZERNAME> |
Legt den Nutzernamen für My JDownloader fest |
--jd-pass=<PASSWORT> |
Legt das Passwort für My JDownloader fest |
--jd-device=<GERÄTENAME> |
Legt den Gerätenamen für My JDownloader fest (optional, wenn nur ein Gerät vorhanden ist) |
Sicherheitshinweis
Der Webserver sollte nie ohne Absicherung im Internet freigegeben werden. Dazu lassen sich im Webinterface Nutzername und Passwort festlegen.
Es empfiehlt sich, zusätzlich einen Reverse-Proxy mit HTTPs-Zertifikat, bspw. kostenlos von letsencrypt, zu verwenden.
Credits
- zapp-brannigan (Idee)
- Gutz-Pilz (Idee)
- mmarquezs (MyJDownloader-API für Python)
- JetBrains PyCharm (Lizenz für die IDE)