DSL-logo
Sprogteknologi // Language Technology

Go to English version 🇬🇧

FLEXIKON – Fuldformsleksikon med bøjningsoplysninger

Ressourcen er udarbejdet af Jørg Asmussen, DSL, omkring 2000, på baggrund af data samlet af Ole Norling-Christensen, DSL, i 1990'erne.

Fuldformsleksikon med samtlige bøjningsformer for 80.000 danske lemmaer samt oplysninger om ordklasse og bøjning.

Lemmaerne er indsamlet fra forskellige ældre ordbogskilder fra årene omkring 1990, og deres mulige bøjningsformer er automatisk udledt ud fra de morfologiske oplysninger i kilderne. I visse tilfælde er oplysningerne blevet automatisk suppleret.

Udvalget af lemmaer og former er meget bredt, og en del af ordene er lavfrekvente i sproget og næppe relevante (fx en række egennavne (proprier) og ad hoc-dannelser). Langt de fleste ord er dog opslagsord i Den Danske Ordbog (DDO). DDO indeholder dog en del ord, primært nyere ord i sproget, der ikke er medtaget på denne liste.

Vigtigt: Ordformerne er ikke blevet tjekket mht. korrekt stavemåde eller overensstemmelse med retskrivningsregler og bøjningsformer fastlagt af Dansk Sprognævn. Hvis du har brug for ortografisk mere pålidelige former eller et mere aktuelt ordstof og samtidig kan undvære bøjningsoplysningerne, er Den Danske Ordbogs fuldformsliste måske et alternativ.

Brug af denne ordliste kræver faglig ekspertise.

Listens opbygning

Opstilling

Bøjningsformernes opstilling på listen kan ses herunder. Udsnittet viser ét lemma (substantivet certifikat).

*
certifikat
S
2 certifikat
4 certifikats
8 certifikatet
16 certifikatets
32 certifikater
64 certifikaters
128 certifikaterne
256 certifikaternes

Hvert nyt lemma på listen indledes med en asterisk * på en separat linje. På den efterfølgende linje optræder lemmaet i sin lemmaform (grundform).

Ordklasser

På 3. linje i opstillingen (jf. ovf.) er lemmaets ordklasse angivet med en forkortelse på ét bogstav:

Fork. Ordklasse
S substantiv
A adjektiv
V verbum
D adverbium
F forkortelse
K konjunktion
L lydord
O pronomen
P egennavn (proprium)
I præfiks
Æ præposition
T talord
U udråbsord
X uidentificeret

Bemærkninger

Ordklassen X omfatter ord som ikke kunne identificeres automatisk. Den omfatter især ord, der kun optræder i faste udtryk sammen med andre ord, fx badut (springe badut), bero (stille i bero), besøgelsestid (kende sin besøgelsestid), herunder også hvert af de enkeltord, der kun findes sammen i et bestemt flerordsudtryk, fx au pair.

Ordklassen I omfatter ud over præfikser som fx di-, eks- og fore- også førsteled af sammensætninger, fx forenings-, forhandlings- og formue-.

Ordklassen P omfatter egennavne (proprier), men da denne ordklasse er meget svær at afgrænse ud fra formelle kriterier, er det til en vis grad tilfældigt, hvad der er kommet med her.

Ordklassen F omfatter primært ortografiske elementer, idet alle forkortelser har fået tildelt en automatisk genereret genitivform med apostrof-s (-´s), også i tilfælde hvor forekomster af disse former ikke er særligt sandsynlige.

Efter linjen med oplysning om ordklasse er ordets forskellige bøjningsformer opstillet. Formerne præsenteres med små bogstaver, også selv om ordet ifølge retskrivningsreglerne skal staves med store bogstaver. Eventuelle bindestreger, punktummer (i forkortelser) og mellemrum (fx i a la) er fjernet fra de bøjede former, men kan udledes af ordets grundform.

Oplysninger om bøjningsformerne

Hver bøjningsform på listen indledes med et tal (adskilt fra formen med tabulatortegn). Tallet angiver, hvilken eller hvilke bøjningsformer af lemmaet den pågældende ordform kan referere til.

Talværdierne udgør et bitmønster, som kan afkodes ud fra dette skema:

position 0 1 2 3  4  5  6   7   8   9   10   11   12   13    14    15
value    1 2 4 8 16 32 64 128 256 512 1024 2048 4096 8192 16384 32768

Hvis talværdien for en ordform fx er 3136, er den fremkommet ved at lægge værdierne 64 + 1024 + 2048 sammen i skemaet ovenfor, altså er bittene i position 6, 10 og 11 sat (=1, mens alle andre er 0). Dermed refererer ordformen til de tre bøjningskategorier, der er knyttet til henholdsvis position 6, 10 og 11. Bøjningskategorierne, som er knyttet til de forskellige positioner, varierer afhængigt af ordklassen.

I skemaet nedenunder vises de former (Form), der er knyttet til de forskellige positioner (Pos.) for hver ordklasse. Formerne angives med engelske betegnelser.

Adjektiver

Pos. Form
1 singular-common gender
2 singular-common gender-genitive (nominal use)
3 singular-neuter
4 singular-neuter-genitive
5 plural/definite
6 plural/definite-genitive (nominal use)
7 comparative/adverb
8 comparative-genitive (nominal use)
9 superlative-singular/adverb
10 superlative-plural/definite
11 superlative-plural/definite-genitive (nominal use)
12 fossilized, e.g. (til) fulde, (du) godeste
13 adverb

Adverbier

Pos. Form
1 positive
2 comparative
3 superlative

Egennavne (proprier)

Pos. Form
1 singular
2 singular-genitive

Substantiver (appellativer)

Pos. Form
1 singular-indefinite
2 singular-indefinite-genitive
3 singular-definite
4 singular-definite-genitive
5 plural-indefinite
6 plural-indefinite-genitive
7 plural-definite
8 plural-definite-genitive
9 fossilized, e.g. (på) tide

Verber

Pos. Form
1 infinitive-active
2 present-active
3 infinitive-passive
4 present-passive
5 preterite-active
6 preterite-passive
7 present participle/adverb
8 present participle-genitive
9 perfect participle-neuter/adverb
10 perfect participle-neuter-genitive
11 perfect participle-common gender
12 perfect participle-common gender-genitive
13 perfect participle-plural/definite
14 perfect participle-plural/definite-genitive
15 imperative

Pronominer

Substantiviske
 1: nominative 2: oblique3: genitive
interrogative/relative hvadhvad 
interrogative/relative hvemhvemhvis
indefinite manenens
personaljegmig 
personaldedemderes
personalviosvores
personalIjer/ederjeres/eders
personaldendendens
personalhunhendehendes
personaldetdetdets
personalDeDemDeres
personalhanham/hannemhans
personaldudig 
personalhinandenhinandens 
reciprocalhverandrehverandres 
reflexivesig  
Adjektiviske
 4: sg-comm.gender5: sg-c.g.-gen6: sg-neut7: sg-neut-gen8: pl9: pl-gen
demden (her/der) det (her/der) de (her/der) 
demdennedennesdettedettesdissedisses
demsådan ensådan enssådan etsådan etssådan nogen/noglesådan nogens/nogles
demhinhinshinthintshinehines
demsådansådanssådantsådantssådannesådannes
i/rhvad for en hvad for et hvad for nogen/nogle 
i/rhvilkenhvilkenshvilkethvilketshvilkehvilkes
indingeningensintetintetsingeningens
indandenandensandetandetsandreandres
indnogennogensnogetnogetsnogen/noglenogens/nogles
indenensetets  
indmangenmangensmangtmangtsmangemanges
indal alt allealles
indhverhvershverthverts  
ind  &nsbp; somme 
indenhverenhversethvertethverts&nnsp; 
possin sit sinesines
posjer jert jere 
posdin dit  dinedines
posvor vort vore 
posmin mit minemines

Listen indeholder også former, der i princippet er mulige ud fra bøjningsmønstret, men som næppe forekommer i tekster. Et eksempel er imperativformen, der angives systematisk ved alle verber, også selv om den næppe forekommer, fx imperativformen klandr af verbet klandre. Mange adjektiver har komparative bøjningsformer, der ikke er reelt forekommende, fx storslåedere afledt af storslået. Talord mangler bøjningsoplysning om, at der er tale om et ordenstal. Endelig kan der være fejl i listen pga. tilfælde af overgenerering af bøjningsformer.

Download

Før du downloader materialet, skal du acceptere betingelserne vedrørende ophavsret, brug og kreditering.


FLEXIKON – Full-form lexicon with morphological specifications

Compiled by Jørg Asmussen, DSL, around 2000, based on data collected by Ole Norling-Christensen, DSL, in the 1990s.

This resource comprises Danish lemmas and their inflected forms including information on parts of speech and inflection.

This word list is intended for expert users.

General

The word list contains more than 80.000 lemmas, each lemma form includes information on all possible inflectional forms.

The lemmas originate from various older lexical sources from around 1990, and their inflectional forms have been automatically derived from the morphological information given in these sources and automatically supplemented in a number of cases. The selection is very wide, and a number of words are hardly relevant (e.g. proper nouns, nonce formations). The majority, however, are words also included in The Danish Dictionary (DDO). In addition, DDO also includes other, particularly newer words that are not in the list.

Note: The forms in the list have not been checked for correctness and compliance with the norm distributed by The Danish Language Council. If you need orthographically more reliable forms and want the newest words as well, but can dispense with morphological specifications, you may want to use the Fullform lexicon of The Danish Dictionary instead.

Composition of the list

Structure

The structure of the list is shown the following excerpt showing one lemma:

*
certifikat
S
2 certifikat
4 certifikats
8 certifikatet
16 certifikatets
32 certifikater
64 certifikaters
128 certifikaterne
256 certifikaternes

A new lemma on the list is always preceded by an asterisk * on a separate line. In the following line the lemma appears in its base or lemma form.

Part of Speech

In line 3 the part of speech is given as a one character abbreviation:

Abbr. POS
S noun
A adjective
V verb
D adverb
F abbreviation
K conjunction
L onomatopoeic word
O pronoun
P proper noun
I prefix
Æ preposition
T numeral
U interjection
X unidentified

Notes

Class X comprises words that could not be automatically identified. In particular it contains words that usually occur exclusively in fixed expressions together with other words, e.g. badut (springe badut), bero (stille i bero), besøgelsestid (kende sin besøgelsestid) or multiword units appearing as a single word, e.g. au pair.

In addition to prefixes proper, e.g. di-, eks-, fore-, class I also comprises the first elements of compounds, e.g. forenings-, forhandlings-, formue-.

Class P comprises proper nouns, but as it is almost impossible to apply usable selection criteria discerning important from unimportant within the class, it is characterised by a degree of coincidence.

Class F reflects primarily an orthographic phenomenon. For all abbreviations, a genitive form with apostrophe s (-'s) has been generated although many of these seem questionable.

The line containing part of speech is followed by the different inflectional forms which the word may take. The forms are always given in lower case letters even if capital letters are used in the normally correct orthographic representation. Hyphens, full stops (in abbreviations) and spaces (a la), if any, are also omitted. The omitted information can, however, always be derived from the base form.

Information on inflectional forms

Each inflectional form in the list is preceded by a number (separated from the word by a tab) indicating which inflectional forms of the lemma the form can be assigned to.

The numbers denote a certain bit pattern according to the following scheme:

position 0 1 2 3  4  5  6   7   8   9   10   11   12   13    14    15
value    1 2 4 8 16 32 64 128 256 512 1024 2048 4096 8192 16384 32768

If the number is, say, 3136, then it is composed of 64 + 1024 + 2048 from the scheme above. Thus the bits in position 6, 10 and 11 are set. Different inflectional categories are attached to each position depending on part of speech.

The following tables show the forms (Form) attached to the individual positions (Pos.) in the bit pattern for relevant part of speech.

Adjectives

Pos. Form
1 singular-common gender
2 singular-common gender-genitive (nominal use)
3 singular-neuter
4 singular-neuter-genitive
5 plural/definite
6 plural/definite-genitive (nominal use)
7 comparative/adverb
8 comparative-genitive (nominal use)
9 superlative-singular/adverb
10 superlative-plural/definite
11 superlative-plural/definite-genitive (nominal use)
12 fossilized, e.g. (til) fulde, (du) godeste
13 adverb

Adverbs

Pos. Form
1 positive
2 comparative
3 superlative

Proper nouns

Pos. Form
  1. singular
  2. singular-genitive

Common nouns

Pos. Form
1 singular-indefinite
2 singular-indefinite-genitive
3 singular-definite
4 singular-definite-genitive
5 plural-indefinite
6 plural-indefinite-genitive
7 plural-definite
8 plural-definite-genitive
9 fossilized, e.g. (på) tide

Verbs

Pos. Form
1 infinitive-active
2 present-active
3 infinitive-passive
4 present-passive
5 preterite-active
6 preterite-passive
7 present participle/adverb
8 present participle-genitive
9 perfect participle-neuter/adverb
10 perfect participle-neuter-genitive
11 perfect participle-common gender
12 perfect participle-common gender-genitive
13 perfect participle-plural/definite
14 perfect participle-plural/definite-genitive
15 imperative

Pronouns

Nominal
 1: nominative 2: oblique3: genitive
interrogative/relative hvadhvad 
interrogative/relative hvemhvemhvis
indefinite manenens
personaljegmig 
personaldedemderes
personalviosvores
personalIjer/ederjeres/eders
personaldendendens
personalhunhendehendes
personaldetdetdets
personalDeDemDeres
personalhanham/hannemhans
personaldudig 
personalhinandenhinandens 
reciprocalhverandrehverandres 
reflexivesig  
Adjectival
 4: sg-comm.gender5: sg-c.g.-gen6: sg-neut7: sg-neut-gen8: pl9: pl-gen
demden (her/der) det (her/der) de (her/der) 
demdennedennesdettedettesdissedisses
demsådan ensådan enssådan etsådan etssådan nogen/noglesådan nogens/nogles
demhinhinshinthintshinehines
demsådansådanssådantsådantssådannesådannes
i/rhvad for en hvad for et hvad for nogen/nogle 
i/rhvilkenhvilkenshvilkethvilketshvilkehvilkes
indingeningensintetintetsingeningens
indandenandensandetandetsandreandres
indnogennogensnogetnogetsnogen/noglenogens/nogles
indenensetets  
indmangenmangensmangtmangtsmangemanges
indal alt allealles
indhverhvershverthverts  
ind  &nsbp; somme 
indenhverenhversethvertethverts&nnsp; 
possin sit sinesines
posjer jert jere 
posdin dit  dinedines
posvor vort vore 
posmin mit minemines

In many cases highly unlikely or unattested (but paradigmatically possible) forms appear. For example, for all verbs the imperative is given, yielding the imperative form produc from the verb produce even if it is hardly likely ever to occur.

Many adjectives have (synthetic) comparative forms which seem quite meaningless, e.g. the comparative of storslået given as storslåedere. For numerals the inflectional category 'ordinality' should have been given, but it is not. Moreover, a number of errors may occur due to automatic overgeneration of inflectional forms.

Download

Before downloading this material, you must accept the conditions for copyright, use, and crediting that apply.