Cristin-resultat-ID: 227793
Sist endret: 11. februar 2008, 12:00
Resultat
Vitenskapelig foredrag
2007

To sider av samme sak — Om leksikalsk og syntaktisk flertydighet i korpora

Bidragsytere:
  • Victoria Rosén og
  • Koenraad De Smedt

Presentasjon

Navn på arrangementet: 12. møte om norsk språk (MONS)
Sted: Stavanger
Dato fra: 22. november 2007
Dato til: 24. november 2007

Arrangør:

Arrangørnavn: Universitetet i Stavanger

Om resultatet

Vitenskapelig foredrag
Publiseringsår: 2007

Beskrivelse Beskrivelse

Tittel

To sider av samme sak — Om leksikalsk og syntaktisk flertydighet i korpora

Sammendrag

Det er bred enighet om at en fremtidig norsk språkbank bør inneholde et syntaktisk annotert korpus. Et slikt korpus vil ha flere bruksområder, men for de fleste som jobber med analyse av norsk språk, vil det viktigste være at man raskt og effektivt vil kunne finne frem til autentiske eksempler av bestemte grammatiske konstruksjoner i moderne norsk. Istedenfor å måtte søke på bestemte ord, vil man for eksempel kunne søke på konstruksjoner som setningskløyving eller presentering. En av de største utfordringene for syntaktisk korpusannotasjon er flertydighet. Setningene i korpuset må derfor ikke bare analyseres syntaktisk, de må også disambigueres, og de valgte analysene må lagres i en såkalt trebank. Prosjektet TREPIL, som inngår i Norges forskningsråds KUNSTI-program, har som mål å utvikle metoder og verktøy for semiautomatisk bygging av en norsk trebank. I dette foredraget vil vi vise hvordan verktøyene utviklet i TREPIL håndterer leksikalsk og syntaktisk flertydighet. Vi har en webbasert, interaktiv annotasjonsplattform som støtter disambiguering gjennom beregning av alle individuelle forskjeller mellom ulike analyser, bl.a. ulike ordkategorier, oppdeling i fraser osv. Vi vil også vise hvordan vår tilnærming fører til en gjensidig berikelse av den lingvistiske informasjonen i korpus, leksikon og grammatikk.

Bidragsytere

Victoria Kay Rosén

Bidragsyterens navn vises på dette resultatet som Victoria Rosén
  • Tilknyttet:
    Forfatter
    ved NORCE Energi og teknologi ved NORCE Norwegian Research Centre AS
Aktiv cristin-person

Koenraad de Smedt

Bidragsyterens navn vises på dette resultatet som Koenraad De Smedt
  • Tilknyttet:
    Forfatter
    ved Institutt for lingvistiske, litterære og estetiske studier ved Universitetet i Bergen
  • Tilknyttet:
    Forfatter
    ved NORCE Energi og teknologi ved NORCE Norwegian Research Centre AS
1 - 2 av 2