DSL-logo
Sprogteknologi // Language Technology

Go to English version ūüá¨ūüáß

FLEXIKON ‚Äď Fuldformsleksikon med b√łjningsoplysninger

Ressourcen er udarbejdet af J√łrg Asmussen, DSL, omkring 2000, p√• baggrund af data samlet af Ole Norling-Christensen, DSL, i 1990'erne.

Fuldformsleksikon med samtlige b√łjningsformer for 80.000 danske lemmaer samt oplysninger om ordklasse og b√łjning.

Lemmaerne er indsamlet fra forskellige √¶ldre ordbogskilder fra √•rene omkring 1990, og deres mulige b√łjningsformer er automatisk udledt ud fra de morfologiske oplysninger i kilderne. I visse tilf√¶lde er oplysningerne blevet automatisk suppleret.

Udvalget af lemmaer og former er meget bredt, og en del af ordene er lavfrekvente i sproget og næppe relevante (fx en række egennavne (proprier) og ad hoc-dannelser). Langt de fleste ord er dog opslagsord i Den Danske Ordbog (DDO). DDO indeholder dog en del ord, primært nyere ord i sproget, der ikke er medtaget på denne liste.

Vigtigt: Ordformerne er ikke blevet tjekket mht. korrekt stavem√•de eller overensstemmelse med retskrivningsregler og b√łjningsformer fastlagt af Dansk Sprogn√¶vn. Hvis du har brug for ortografisk mere p√•lidelige former eller et mere aktuelt ordstof og samtidig kan undv√¶re b√łjningsoplysningerne, er Den Danske Ordbogs fuldformsliste m√•ske et alternativ.

Brug af denne ordliste kræver faglig ekspertise.

Listens opbygning

Opstilling

B√łjningsformernes opstilling p√• listen kan ses herunder. Udsnittet viser √©t lemma (substantivet certifikat).

*
certifikat
S
2 certifikat
4 certifikats
8 certifikatet
16 certifikatets
32 certifikater
64 certifikaters
128 certifikaterne
256 certifikaternes

Hvert nyt lemma p√• listen indledes med en asterisk * p√• en separat linje. P√• den efterf√łlgende linje optr√¶der lemmaet i sin lemmaform (grundform).

Ordklasser

På 3. linje i opstillingen (jf. ovf.) er lemmaets ordklasse angivet med en forkortelse på ét bogstav:

Fork. Ordklasse
S substantiv
A adjektiv
V verbum
D adverbium
F forkortelse
K konjunktion
L lydord
O pronomen
P egennavn (proprium)
I præfiks
Æ præposition
T talord
U udråbsord
X uidentificeret

Bemærkninger

Ordklassen X omfatter ord som ikke kunne identificeres automatisk. Den omfatter is√¶r ord, der kun optr√¶der i faste udtryk sammen med andre ord, fx badut (springe badut), bero (stille i bero), bes√łgelsestid (kende sin bes√łgelsestid), herunder ogs√• hvert af de enkeltord, der kun findes sammen i et bestemt flerordsudtryk, fx au pair.

Ordklassen I omfatter ud over pr√¶fikser som fx di-, eks- og fore- ogs√• f√łrsteled af sammens√¶tninger, fx forenings-, forhandlings- og formue-.

Ordklassen P omfatter egennavne (proprier), men da denne ordklasse er meget svær at afgrænse ud fra formelle kriterier, er det til en vis grad tilfældigt, hvad der er kommet med her.

Ordklassen F omfatter prim√¶rt ortografiske elementer, idet alle forkortelser har f√•et tildelt en automatisk genereret genitivform med apostrof-s (-¬īs), ogs√• i tilf√¶lde hvor forekomster af disse former ikke er s√¶rligt sandsynlige.

Efter linjen med oplysning om ordklasse er ordets forskellige b√łjningsformer opstillet. Formerne pr√¶senteres med sm√• bogstaver, ogs√• selv om ordet if√łlge retskrivningsreglerne skal staves med store bogstaver. Eventuelle bindestreger, punktummer (i forkortelser) og mellemrum (fx i a la) er fjernet fra de b√łjede former, men kan udledes af ordets grundform.

Oplysninger om b√łjningsformerne

Hver b√łjningsform p√• listen indledes med et tal (adskilt fra formen med tabulatortegn). Tallet angiver, hvilken eller hvilke b√łjningsformer af lemmaet den p√•g√¶ldende ordform kan referere til.

Talv√¶rdierne udg√łr et bitm√łnster, som kan afkodes ud fra dette skema:

position 0 1 2 3 4 5 6  7  8  9  10  11  12  13  14  15
value  1 2 4 8 16 32 64 128 256 512 1024 2048 4096 8192 16384 32768

Hvis talv√¶rdien for en ordform fx er 3136, er den fremkommet ved at l√¶gge v√¶rdierne 64 + 1024 + 2048 sammen i skemaet ovenfor, alts√• er bittene i position 6, 10 og 11 sat (=1, mens alle andre er 0). Dermed refererer ordformen til de tre b√łjningskategorier, der er knyttet til henholdsvis position 6, 10 og 11. B√łjningskategorierne, som er knyttet til de forskellige positioner, varierer afh√¶ngigt af ordklassen.

I skemaet nedenunder vises de former (Form), der er knyttet til de forskellige positioner (Pos.) for hver ordklasse. Formerne angives med engelske betegnelser.

Adjektiver

Pos. Form
1 singular-common gender
2 singular-common gender-genitive (nominal use)
3 singular-neuter
4 singular-neuter-genitive
5 plural/definite
6 plural/definite-genitive (nominal use)
7 comparative/adverb
8 comparative-genitive (nominal use)
9 superlative-singular/adverb
10 superlative-plural/definite
11 superlative-plural/definite-genitive (nominal use)
12 fossilized, e.g. (til) fulde, (du) godeste
13 adverb

Adverbier

Pos. Form
1 positive
2 comparative
3 superlative

Egennavne (proprier)

Pos. Form
1 singular
2 singular-genitive

Substantiver (appellativer)

Pos. Form
1 singular-indefinite
2 singular-indefinite-genitive
3 singular-definite
4 singular-definite-genitive
5 plural-indefinite
6 plural-indefinite-genitive
7 plural-definite
8 plural-definite-genitive
9 fossilized, e.g. (på) tide

Verber

Pos. Form
1 infinitive-active
2 present-active
3 infinitive-passive
4 present-passive
5 preterite-active
6 preterite-passive
7 present participle/adverb
8 present participle-genitive
9 perfect participle-neuter/adverb
10 perfect participle-neuter-genitive
11 perfect participle-common gender
12 perfect participle-common gender-genitive
13 perfect participle-plural/definite
14 perfect participle-plural/definite-genitive
15 imperative

Pronominer

Substantiviske
 1: nominative 2: oblique3: genitive
interrogative/relative hvadhvad 
interrogative/relative hvemhvemhvis
indefinite manenens
personaljegmig 
personaldedemderes
personalviosvores
personalIjer/ederjeres/eders
personaldendendens
personalhunhendehendes
personaldetdetdets
personalDeDemDeres
personalhanham/hannemhans
personaldudig 
personalhinandenhinandens 
reciprocalhverandrehverandres 
reflexivesig  
Adjektiviske
 4: sg-comm.gender5: sg-c.g.-gen6: sg-neut7: sg-neut-gen8: pl9: pl-gen
demden (her/der) det (her/der) de (her/der) 
demdennedennesdettedettesdissedisses
demsådan ensådan enssådan etsådan etssådan nogen/noglesådan nogens/nogles
demhinhinshinthintshinehines
demsådansådanssådantsådantssådannesådannes
i/rhvad for en hvad for et hvad for nogen/nogle 
i/rhvilkenhvilkenshvilkethvilketshvilkehvilkes
indingeningensintetintetsingeningens
indandenandensandetandetsandreandres
indnogennogensnogetnogetsnogen/noglenogens/nogles
indenensetets  
indmangenmangensmangtmangtsmangemanges
indal alt allealles
indhverhvershverthverts  
ind  &nsbp; somme 
indenhverenhversethvertethverts&nnsp; 
possin sit sinesines
posjer jert jere 
posdin dit  dinedines
posvor vort vore 
posmin mit minemines

Listen indeholder ogs√• former, der i princippet er mulige ud fra b√łjningsm√łnstret, men som n√¶ppe forekommer i tekster. Et eksempel er imperativformen, der angives systematisk ved alle verber, ogs√• selv om den n√¶ppe forekommer, fx imperativformen klandr af verbet klandre. Mange adjektiver har komparative b√łjningsformer, der ikke er reelt forekommende, fx storsl√•edere afledt af storsl√•et. Talord mangler b√łjningsoplysning om, at der er tale om et ordenstal. Endelig kan der v√¶re fejl i listen pga. tilf√¶lde af overgenerering af b√łjningsformer.

Download

F√łr du downloader materialet, skal du acceptere betingelserne vedr√łrende ophavsret, brug og kreditering.


FLEXIKON ‚Äď Full-form lexicon with morphological specifications

Compiled by J√łrg Asmussen, DSL, around 2000, based on data collected by Ole Norling-Christensen, DSL, in the 1990s.

This resource comprises Danish lemmas and their inflected forms including information on parts of speech and inflection.

This word list is intended for expert users.

General

The word list contains more than 80.000 lemmas, each lemma form includes information on all possible inflectional forms.

The lemmas originate from various older lexical sources from around 1990, and their inflectional forms have been automatically derived from the morphological information given in these sources and automatically supplemented in a number of cases. The selection is very wide, and a number of words are hardly relevant (e.g. proper nouns, nonce formations). The majority, however, are words also included in The Danish Dictionary (DDO). In addition, DDO also includes other, particularly newer words that are not in the list.

Note: The forms in the list have not been checked for correctness and compliance with the norm distributed by The Danish Language Council. If you need orthographically more reliable forms and want the newest words as well, but can dispense with morphological specifications, you may want to use the Fullform lexicon of The Danish Dictionary instead.

Composition of the list

Structure

The structure of the list is shown the following excerpt showing one lemma:

*
certifikat
S
2 certifikat
4 certifikats
8 certifikatet
16 certifikatets
32 certifikater
64 certifikaters
128 certifikaterne
256 certifikaternes

A new lemma on the list is always preceded by an asterisk * on a separate line. In the following line the lemma appears in its base or lemma form.

Part of Speech

In line 3 the part of speech is given as a one character abbreviation:

Abbr. POS
S noun
A adjective
V verb
D adverb
F abbreviation
K conjunction
L onomatopoeic word
O pronoun
P proper noun
I prefix
Æ preposition
T numeral
U interjection
X unidentified

Notes

Class X comprises words that could not be automatically identified. In particular it contains words that usually occur exclusively in fixed expressions together with other words, e.g. badut (springe badut), bero (stille i bero), bes√łgelsestid (kende sin bes√łgelsestid) or multiword units appearing as a single word, e.g. au pair.

In addition to prefixes proper, e.g. di-, eks-, fore-, class I also comprises the first elements of compounds, e.g. forenings-, forhandlings-, formue-.

Class P comprises proper nouns, but as it is almost impossible to apply usable selection criteria discerning important from unimportant within the class, it is characterised by a degree of coincidence.

Class F reflects primarily an orthographic phenomenon. For all abbreviations, a genitive form with apostrophe s (-'s) has been generated although many of these seem questionable.

The line containing part of speech is followed by the different inflectional forms which the word may take. The forms are always given in lower case letters even if capital letters are used in the normally correct orthographic representation. Hyphens, full stops (in abbreviations) and spaces (a la), if any, are also omitted. The omitted information can, however, always be derived from the base form.

Information on inflectional forms

Each inflectional form in the list is preceded by a number (separated from the word by a tab) indicating which inflectional forms of the lemma the form can be assigned to.

The numbers denote a certain bit pattern according to the following scheme:

position 0 1 2 3 4 5 6  7  8  9  10  11  12  13  14  15
value  1 2 4 8 16 32 64 128 256 512 1024 2048 4096 8192 16384 32768

If the number is, say, 3136, then it is composed of 64 + 1024 + 2048 from the scheme above. Thus the bits in position 6, 10 and 11 are set. Different inflectional categories are attached to each position depending on part of speech.

The following tables show the forms (Form) attached to the individual positions (Pos.) in the bit pattern for relevant part of speech.

Adjectives

Pos. Form
1 singular-common gender
2 singular-common gender-genitive (nominal use)
3 singular-neuter
4 singular-neuter-genitive
5 plural/definite
6 plural/definite-genitive (nominal use)
7 comparative/adverb
8 comparative-genitive (nominal use)
9 superlative-singular/adverb
10 superlative-plural/definite
11 superlative-plural/definite-genitive (nominal use)
12 fossilized, e.g. (til) fulde, (du) godeste
13 adverb

Adverbs

Pos. Form
1 positive
2 comparative
3 superlative

Proper nouns

Pos. Form
 1. singular
 2. singular-genitive

Common nouns

Pos. Form
1 singular-indefinite
2 singular-indefinite-genitive
3 singular-definite
4 singular-definite-genitive
5 plural-indefinite
6 plural-indefinite-genitive
7 plural-definite
8 plural-definite-genitive
9 fossilized, e.g. (på) tide

Verbs

Pos. Form
1 infinitive-active
2 present-active
3 infinitive-passive
4 present-passive
5 preterite-active
6 preterite-passive
7 present participle/adverb
8 present participle-genitive
9 perfect participle-neuter/adverb
10 perfect participle-neuter-genitive
11 perfect participle-common gender
12 perfect participle-common gender-genitive
13 perfect participle-plural/definite
14 perfect participle-plural/definite-genitive
15 imperative

Pronouns

Nominal
 1: nominative 2: oblique3: genitive
interrogative/relative hvadhvad 
interrogative/relative hvemhvemhvis
indefinite manenens
personaljegmig 
personaldedemderes
personalviosvores
personalIjer/ederjeres/eders
personaldendendens
personalhunhendehendes
personaldetdetdets
personalDeDemDeres
personalhanham/hannemhans
personaldudig 
personalhinandenhinandens 
reciprocalhverandrehverandres 
reflexivesig  
Adjectival
 4: sg-comm.gender5: sg-c.g.-gen6: sg-neut7: sg-neut-gen8: pl9: pl-gen
demden (her/der) det (her/der) de (her/der) 
demdennedennesdettedettesdissedisses
demsådan ensådan enssådan etsådan etssådan nogen/noglesådan nogens/nogles
demhinhinshinthintshinehines
demsådansådanssådantsådantssådannesådannes
i/rhvad for en hvad for et hvad for nogen/nogle 
i/rhvilkenhvilkenshvilkethvilketshvilkehvilkes
indingeningensintetintetsingeningens
indandenandensandetandetsandreandres
indnogennogensnogetnogetsnogen/noglenogens/nogles
indenensetets  
indmangenmangensmangtmangtsmangemanges
indal alt allealles
indhverhvershverthverts  
ind  &nsbp; somme 
indenhverenhversethvertethverts&nnsp; 
possin sit sinesines
posjer jert jere 
posdin dit  dinedines
posvor vort vore 
posmin mit minemines

In many cases highly unlikely or unattested (but paradigmatically possible) forms appear. For example, for all verbs the imperative is given, yielding the imperative form produc from the verb produce even if it is hardly likely ever to occur.

Many adjectives have (synthetic) comparative forms which seem quite meaningless, e.g. the comparative of storslået given as storslåedere. For numerals the inflectional category 'ordinality' should have been given, but it is not. Moreover, a number of errors may occur due to automatic overgeneration of inflectional forms.

Download

Before downloading this material, you must accept the conditions for copyright, use, and crediting that apply.