Corpus Resources & Documentation

CoREST 2018 (beta)

Lav dine egne sproglige undersøgelser i store danske tekstkorpusser!
Se mere info, vejledning og hjælp i CoREST-manualen.

CoREST 2018 efter en søgning på digitalisering
CoREST 2018 efter en søgning på “digitalisering”

Hvad er CoREST?

CoREST er et værktøj til søgninger og avancerede sproglige undersøgelser i meget store tekstsamlinger, såkaldte tekstkorpusser.

CoREST bruges af redaktionen på Den Danske Ordbog til at finde nye ord og betydninger i et meget stort, redaktionsinternt korpus med. Det er også fra dette korpus, at redaktionen henter citater, som skal illustrere ordenes brug i ordbogen.

CoREST står for Corpus Retrieval System & Tools.

CoREST kan ikke bruges til informations- eller tekstsøgning! Af ophavsretlige grunde vil du kun kunne se begrænsede tekstudsnit (citater) omkring dine fund. Til informations- og tekstsøgning henviser vi til Infomedias Mediearkiv.

For alle sproginteresserede

Alle sproginteresserede kan få adgang til en lidt forenklet standard-udgave af CoREST til egne undersøgelser. CoREST giver adgang til mere aktuelle og betydeligt større korpusser end web-versionen af KorpusDK. Med CoREST kan du søge i

Alle korpusser har ordklasseoplysninger, som automatisk blev tilføjet af ePOS-taggeren.

Med CoREST 2018 kan du

CoREST, tekstsamlingerne samt tilhørende manualer, websider, sprogteknologiske metoder og værktøjer er udarbejdet af Jørg AsmussenDSL.

Eksempel på tidsstudier i CoREST
Eksempel på tidsstudier i CoREST

Downloade, installere og starte

CoREST er ikke et selvforklarende program. Derfor bør du læse manualen, før du downloader og bruger CoREST.

CoREST kan downloades frit her fra sitet.

Vær dog opmærksom på, at

1. downloade

Aktuel version: CoREST 2018hent den her!

CoREST kommer i form af en sammenpakket fil, hvis navn ender på .zip.

Det fulde navn på zip-filen afhænger blandt andet af udgaven og versionen, men vil altid begynde med corest.

Efter download skal du pakke zip-filen ud. Det sker som regel ved, at du blot dobbeltklikker på filen. Eventuelt har din computer allerede automatisk sørget for det i forbindelse med download af filen.

2. installere

Efter udpakningen af zip-filen er der oprettet en mappe med navnet CoREST_FX. Vi kalder denne mappe for CoREST’s programmappe.

Du kan lægge programmappen et vilkårligt sted på din maskine; oplagt er dog det sted, hvor dine øvrige programmer ligger. Når du har lagt programmappen der, hvor du vil have den, åbner du mappen ved at dobbeltklikke på den. Du vil her bl.a. se en fil ved navn CoREST_FX.jar. CoREST startes ved at dobbeltklikke på denne fil. Hverken denne eller andre filer må fjernes fra programmappen! Derfor kan det være en idé at oprette en genvej til CoREST_FX.jar, fx fra Windows’ skrivebord eller fra Mac’ens dock. Nu er du færdig med installationen og klar til at bruge CoREST.

3. starte

CoREST startes, idet du dobbeltklikker på filen CoREST_FX.jar, som ligger i CoREST-programmappen, eller ved at dobbeltklikke på den genvej, du eventuelt har oprettet hertil. Din computer skal være på internettet, ellers virker CoREST ikke.

“Ukendt udvikler” på Mac: Første gang, du åbner CoREST på en Mac, vil der sandsynligvis komme en meddelelse om, at programmet stammer fra en ukendt udvikler og derfor ikke kan startes. I så fald finder du frem til programfilen CoREST_FX.jar, højreklikker på den, så en lokal menu kommer op, og vælger Åbn fra denne menu. Igen bliver du advaret om, at programmet stammer fra en ukendt udvikler, men denne gang kan du åbne det ved at klikke på knappen Åbn i den dialogboks, der kommer op. Du skal kun igennem denne procedure én gang, herefter vil CoREST kunne startes som alle øvrige programmer på din Mac.

VIGTIGT: Læs manualen!

CoREST er et specialværktøj til professionelle ordbogsredaktører. Det er derfor desværre ikke helt let at gå til.

I en udførlig manual til korpusværktøjet CoREST kan du få hjælp!

Manualen beskriver, hvordan man installerer og starter CoREST, og gennemgår herefter samtlige funktioner i værktøjet. Til gennemgangen knytter der sig mange konkrete eksempler, som vil gøre dig fortrolig med mulighederne i CoREST.

Selvom manualen vedrører CoREST 2017, gælder den også den aktuelle version af CoREST.

Særlig research-udgave af CoREST

Research-udgaven af CoREST henvender sig især til sprogforskere, som har brug for udvidede muligheder for annotering af fund. Disse muligheder er beskrevet under 3.8 (side 52–57) i en udvidet udgave af manualen. Research-udgaven giver desuden adgang til det tyske SdeWaC-korpus, jævnfør 6.5 på side 90 i den udvidede manual. Du kan anmode om adgang til research-udgaven ved at henvende dig til korpus@dsl.dk med en kort beskrivelse af dit forskningsprojekt. OBS! Standard-udgaven af CoREST kan downloades uden forudgående henvendelse til os.

Corpus Resources & DocumentationJørg Asmussen @ DSL