Korpus · Ressourcer · Dokumentation
OBS! NY VERSION! Den 11.3.2021 udkom der en ny version af CoREST, som erstatter den tidligere. Ældre versioner af CoREST virker ikke længere og skal erstattes af den nye version, som du kan downloade fra denne side.
CoREST er et værktøj til sproglige undersøgelser i meget store tekstsamlinger, såkaldte tekstkorpusser.
Søgeværktøjet CoREST bruges af redaktionen på Den Danske Ordbog til at finde nye ord og betydninger i et meget stort, redaktionsinternt korpus med. Dette korpus hedder BAKSPEJLET og indeholder tekstmateriale fra 1980 frem til i dag med samlet over én milliard ord. Det er også fra dette korpus, at redaktionen henter citater, som skal illustrere ordenes brug i ordbogen.
CoREST står for Corpus Retrieval System & Tools.
Du kan her på siden få adgang til en lidt forenklet Standard-udgave af CoREST til dine egne undersøgelser. Denne udgave af CoREST giver ganske vist ikke adgang til det redaktionsinterne korpus BAKSPEJLET, men til en række mere aktuelle og betydeligt større korpusser end web-versionen af KorpusDK. Med CoREST kan du søge i
{...}
).Alle korpusser har ordklasseoplysninger, som automatisk blev tilføjet ved hjælp af ePOS-taggeren.
Med CoREST kan du
OBS! CoREST kan ikke bruges til informations- eller tekstsøgning! Af ophavsretlige grunde vil du kun kunne se begrænsede tekstudsnit (citater) omkring dine fund. Til informations- og tekstsøgning henviser vi til Infomedias Mediearkiv. CoREST indeholder kun rå tekst, altså ingen illustrationer, tabeller eller lignende.
CoREST, tekstsamlingerne samt tilhørende manualer, websider, sprogteknologiske metoder og værktøjer er udarbejdet af Jørg Asmussen på DSL.
CoREST kan downloades frit her fra sitet. Vær dog opmærksom på, at
Version | Dato | Download |
---|---|---|
CoREST 2021 | 2021-03-11 | Klik her |
CoREST kommer i form af en java-programfil, hvis navn ender på .jar.
Det fulde navn på programfilen afhænger blandt andet af udgaven og versionen, men vil altid begynde med CoREST.
Du kan lægge jar-programfilen et vilkårligt sted på din computer, oplagt er dog den mappe, hvori dine øvrige programmer ligger.
CoREST startes ved, at du dobbeltklikker på jar-programfilen. Din computer skal være på internettet, ellers virker CoREST ikke.
Første gang, du åbner CoREST på en Mac, bør der komme en meddelelse om, at programmet stammer fra en ukendt udvikler, og det vil ikke kunne startes. Du skal nu finde frem til programfilen CoREST-ååå-mm-dd-std.jar, højreklikke på den, så en lokal menu kommer op, og vælge Åbn fra denne menu. Igen bliver du advaret om, at programmet stammer fra en ukendt udvikler, men denne gang kan du åbne det ved at klikke på knappen Åbn i den dialogboks, der kommer op. Du skal kun igennem denne procedure én gang, herefter vil CoREST kunne startes som alle øvrige programmer på din Mac.
CoREST er et specialværktøj til professionelle ordbogsredaktører. Det er derfor desværre ikke helt let at gå til.
I en udførlig manual til korpusværktøjet CoREST kan du få hjælp!
Manualen beskriver, hvordan man installerer og starter CoREST, og den gennemgår herefter samtlige funktioner i værktøjet. Til gennemgangen knytter der sig mange konkrete eksempler og opgaver, som vil gøre dig fortrolig med mulighederne i CoREST.
*Research*-udgaven af CoREST henvender sig især til sprogforskere, som har brug for udvidede muligheder for annotering af fund. Disse muligheder er beskrevet i manualen. Du kan også få adgang til Research ved at henvende dig til korpus@dsl.dk med en kort beskrivelse af dit forskningsprojekt.
CoREST m.m. er udviklet af Jørg Asmussen