Tagger/exclude.py

110 lines
1.3 KiB
Python

EXCLUDED_WORDS = {
# Deutsche wörter
"aber",
"alle",
"als",
"am",
"an",
"auch",
"auf",
"aus",
"bei",
"bis",
"dabei",
"dafür",
"damit",
"das",
"dass",
"davon",
"dem",
"den",
"der",
"des",
"die",
"diese",
"dir",
"dort",
"du",
"ein",
"ein",
"eine",
"einem",
"einen",
"einer",
"eines",
"einige",
"er",
"es",
"etwas",
"euch",
"für",
"gibt",
"haben",
"hat",
"hier",
"ich",
"ihr",
"im",
"immer",
"in",
"ins",
"ist",
"jetzt",
"kann",
"man",
"mehr",
"mein",
"meine",
"mich",
"mir",
"mit",
"nach",
"nicht",
"noch",
"nur",
"oder",
"ohne",
"schade",
"sehr",
"sein",
"seit",
"sich",
"sie",
"sind",
"um",
"und",
"viele",
"von",
"vor",
"war",
"wenn",
"werden",
"wie",
"wir",
"wird",
"zu",
"zum",
"zur",
"über",
# Englische wörter
"and",
"about",
"in",
"more",
"much",
"of",
"or",
"this",
"your",
# URL Bestandteile
"https",
"http",
"www",
"com",
"de",
"org",
"net",
"it",
"ch",
}