update README.md
This commit is contained in:
parent
0856e32443
commit
40c74bf61c
1 changed files with 24 additions and 1 deletions
25
README.md
25
README.md
|
@ -3,14 +3,37 @@
|
||||||
Generiert Tags aus HTML-Artikeln.
|
Generiert Tags aus HTML-Artikeln.
|
||||||
|
|
||||||
Eine pure-python Lösung für
|
Eine pure-python Lösung für
|
||||||
einen [GNU/Linux.ch Wettbewerb](https://gnulinux.ch/wettbewerb-gnu-linux-ch-verschlagworten)
|
einen [GNU/Linux.ch Wettbewerb](https://gnulinux.ch/wettbewerb-gnu-linux-ch-verschlagworten).
|
||||||
|
|
||||||
|
## Funktionsweise
|
||||||
|
|
||||||
|
1. Extrahiert den Text aus dem HTML
|
||||||
|
2. Jedes Wort bekommt eine Bewertung nach bestimmten Kriterien
|
||||||
|
3. Die Wörter mit den höchsten Bewertungen werden als Tags vorgeschlagen
|
||||||
|
|
||||||
## Voraussetzungen
|
## Voraussetzungen
|
||||||
|
|
||||||
- Python 3.9
|
- Python 3.9
|
||||||
|
- Ein `data` Ordner mit folgender Struktur:
|
||||||
|
```
|
||||||
|
├── data
|
||||||
|
│ ├── ausblick-auf-kde-plasma-5-23-verbessertes-breeze-theme
|
||||||
|
│ │ └── index.txt
|
||||||
|
│ ├── aus-feedreader-wird-newsflash
|
||||||
|
│ │ └── index.txt
|
||||||
|
│ ├── auslieferung-des-volla-phones-fuer-november-geplant
|
||||||
|
│ │ └── index.txt
|
||||||
|
│ ├── autosave-320f77ed720ec9dd09e35e4ebee5235d
|
||||||
|
│ │ └── index.txt
|
||||||
|
│ ├── background-remover
|
||||||
|
│ │ └── index.txt
|
||||||
|
```
|
||||||
|
Ordner, die mit `autosave-` beginnen, werden ignoriert.
|
||||||
|
|
||||||
## Verwendung
|
## Verwendung
|
||||||
|
|
||||||
```
|
```
|
||||||
python3 tagger.py
|
python3 tagger.py
|
||||||
```
|
```
|
||||||
|
|
||||||
|
Das Ergebnis ist in der `tags.json` zu finden.
|
||||||
|
|
Loading…
Reference in a new issue