Cristin-resultat-ID: 2099353
Sist endret: 17. februar 2023, 15:36
NVI-rapporteringsår: 2022
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2022

The Norwegian Dialect Corpus Treebank

Bidragsytere:
  • Andre Kåsen
  • Kristin Hagen
  • Anders Nøklestad
  • Joel Priestley
  • Per Erik Solberg og
  • Dag Trygve Truslew Haug

Bok

Proceedings of the Thirteenth Language Resources and Evaluation Conference
ISBN:
  • 979-10-95546-72-6

Utgiver

European Language Resources Association
NVI-nivå 1

Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2022
Sider: 4827 - 4832
ISBN:
  • 979-10-95546-72-6
Open Access

Klassifisering

Fagfelt (NPI)

Fagfelt: Lingvistikk
- Fagområde: Humaniora

Beskrivelse Beskrivelse

Tittel

The Norwegian Dialect Corpus Treebank

Sammendrag

This paper presents the NDC Treebank of spoken Norwegian dialects in the Bokmal variety of Norwegian. It consists of dialect ˚ recordings made between 2006 and 2012 which have been digitised, segmented, transcribed and subsequently annotated with morphological and syntactic analysis. The nature of the spoken data gives rise to various challenges both in segmentation and annotation. We follow earlier efforts for Norwegian, in particular the LIA Treebank of spoken dialects transcribed in the Nynorsk variety of Norwegian, in the annotation principles to ensure interusability of the resources. We have developed a spoken language parser on the basis of the annotated material and report on its accuracy both on a test set across the dialects and by holding out single dialects.

Bidragsytere

Andre Kåsen

  • Tilknyttet:
    Forfatter
    ved Språkbank og DH-lab ved Nasjonalbiblioteket

Kristin Hagen

  • Tilknyttet:
    Forfatter
    ved Tekstlaboratoriet ved Universitetet i Oslo

Anders Nøklestad

  • Tilknyttet:
    Forfatter
    ved Tekstlaboratoriet ved Universitetet i Oslo

Joel Priestley

  • Tilknyttet:
    Forfatter
    ved Tekstlaboratoriet ved Universitetet i Oslo

Per Erik Solberg

  • Tilknyttet:
    Forfatter
    ved Språkbank og DH-lab ved Nasjonalbiblioteket
1 - 5 av 6 | Neste | Siste »

Resultatet er en del av Resultatet er en del av

Proceedings of the Thirteenth Language Resources and Evaluation Conference.

Calzolari, Nicoletta; Béchet, Frédéric; Blache, Philippe; Choukri, Khalid; Cieri, Christopher; Declerck, Thierry; Goggi, Sara; Isahara, Hitoshi; Maegaard, Bente; Mariani, Joseph mfl.. 2022, European Language Resources Association. Vitenskapelig antologi/Konferanseserie
1 - 1 av 1