#
# This is a non-breaking prefix list for the Danish language.
# The file is used for sentence tokenization (text -> sentence splitting).
#
# The file was adapted from LanguageTool package (src/main/java/org/languagetool/tokenizers/da/DanishSentenceTokenizer.java):
#     http://www.languagetool.org/
#

# Anything in this file, followed by a period (and an upper-case word), does NOT
# indicate an end-of-sentence marker.
# Special cases are included for prefixes that ONLY appear before 0-9 numbers.

# Any single upper case letter followed by a period is not a sentence ender
# (excluding I occasionally, but we leave it in).
# Usually upper case letters are initials in a name.
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z

# Usually upper case letters are initials in a name (Danish / Norwegian alphabet)
Æ
Ø
Å

# English -- but these work globally for all languages:
Mr
Mrs
No
pp
St
no
Sr
Jr
Bros
etc
vs
esp
Fig
fig
Jan
Feb
Mar
Apr
Jun
Jul
Aug
Sep
Sept
Oct
Okt
Nov
Dec
Ph.D
PhD
# in "et al."
al
cf
Inc
Ms
Gen
Sen
Prof
Dr
Corp
Co

# DanishSentenceTokenizer.java
abs
abstr
adj
adm
adr
adv
afd
afg
afl
afs
afvig
agro
akad
akk
allr
alm
amer
anat
ang
anm
anv
apot
appos
apr
arab
arkais
arkæol
arp
arr
art
ass
astr
att
attrib
aud
aug
aut
bag
barb
barnespr
bd
bdt
beg
besl
best
bet
bhk
biavl
bibet
bibl
bibliot
billard
billedl
biol
bjergv
bk
bl
bogb
bogh
bogtr
bornh
bot
br
bryg
bto
bygn
bødk
ca
cand
Chr
cirk
cit
co
d
da
dagl
dans
dat
dec
def
demonstr
dep
dial
diam
dim
disp
distr
distrib
dobb
dr
dvs
e
egl
eks
eksam
ekskl
eksp
ekspl
el
ell
ellipt
emb
endv
eng
enk
ent
etc
etnogr
eufem
eur
event
evt
f
fagl
fakt
farv
feb
ff
fhv
fig
filos
fisk
fk
fl
flg
flt
flyv
fmd
fon
foragt
forb
foreg
forf
forsikr
forsk
forst
foræld
fot
fr
fre
fris
frk
fsv
fuldm
fx
fys
fysiol
fægt
gart
gartn
garv
gdr
gen
genopt
geogr
geol
geom
germ
gl
glarm
glda
gldgs
glholl
glno
gns
got
gr
gradbøjn
gram
gross
grundbet
græc
guldsm
gym
h
hat
hd
hebr
henh
hensobj
herald
hhv
hist
hj
holl
hovedbet
hr
hty
højtid
haandarb
haandv
i
if
ifm
ift
iht
imp
indb
indik
inf
ing
Inkl
inkl
insp
instr
interj
intk
intr
iron
isl
ital
jan
jarg
jf
jnr
jr
jul
jun
jur
jy
jæg
jærnb
jød
Kbh
kbh
kem
kgl
kirk
kl
kld
knsp
kog
koll
komm
komp
konj
konkr
kons
Kr
kr
kurv
kvt
køkkenspr
l
landbr
landmaaling
lat
lb
lic
lign
litt
Ll
log
Loll
loll
lrs
lør
m
maj
maks
mal
man
mar
mat
mdl
mdr
med
medl
meng
merc
meteorol
meton
metr
mf
mfl
mht
mia
min
mineral
mio
ml
mlat
mm
mnt
mods
modsætn
modt
mr
mrk
mur
mv
mvh
mytol
møl
mønt
n
naturv
ndf
Ndr
nedsæt
nht
no
nom
nov
nr
nt
num
nyda
nydann
nylat
naal
obj
obl
oblik
obs
odont
oecon
oeng
ofl
ogs
oht
okt
oldfr
oldfris
oldn
olgn
omg
omkr
omtr
ons
opr
ordspr
org
osax
osv
ovenst
overf
overs
ovf
p
pag
part
pass
pct
perf
pga
ph
pharm
phil
pk
pkt
pl
plur
poet
polit
port
poss
post
pott
pr
pron
propr
prov
præd
præp
præs
præt
psych
pt
pæd
paavirkn
reb
ref
refl
regn
relat
relig
resp
retor
rid
rigsspr
run
russ
s
sa
sanskr
scient
sdjy
sdr
sek
sen
sep
sept
shetl
sj
sjæll
skibsbygn
sko
skol
skr
skriftspr
skræd
Skt
slagt
slutn
smed
sml
smsat
smst
snedk
soldat
sp
spec
sport
spot
spr
sprogv
spøg
ssg
ssgr
st
stk
str
stud
subj
subst
superl
sv
sætn
søn
talem
talespr
tandl
td
tdl
teat
techn
telef
telegr
teol
th
theol
tir
tirs
tlf
told
tor
tors
trans
tsk
ty
tyrk
tøm
u
ubesl
ubest
udd
udenl
udg
udtr
uegl
ugtl
ult
underbet
undt
univ
upers
ur
urnord
v
var
vbs
vedk
vedl
vedr
vejl
verb
vet
vha
vol
vs
vsa
vulg
væv
zool
æ
æda
ænht
ænyd
æstet
ø
å
årg
årh
