Cristin-resultat-ID: 1565944
Sist endret: 1. februar 2019, 10:42
NVI-rapporteringsår: 2018
Resultat
Vitenskapelig artikkel
2018

The Talk of Norway: A Richly Annotated Corpus of the Norwegian Parliament, 1998–2016

Bidragsytere:
  • Emanuele Lapponi
  • Martin G. Søyland
  • Erik Velldal og
  • Stephan Oepen

Tidsskrift

Language Resources and Evaluation
ISSN 1574-020X
e-ISSN 1574-0218
NVI-nivå 2

Om resultatet

Vitenskapelig artikkel
Publiseringsår: 2018
Publisert online: 2018
Volum: 52
Hefte: 3
Sider: 873 - 893
Open Access

Importkilder

Scopus-ID: 2-s2.0-85041931233

Beskrivelse Beskrivelse

Tittel

The Talk of Norway: A Richly Annotated Corpus of the Norwegian Parliament, 1998–2016

Sammendrag

In this work we present the Talk of Norway (ToN) data set, a collection of Norwegian Parliament speeches from 1998 to 2016. Every speech is richly annotated with metadata harvested from different sources, and augmented with language type, sentence, token, lemma, part-of-speech, and morphological feature annotations. We also present a pilot study on party classification in the Norwegian Parliament, carried out in the context of a cross-faculty collaboration involving researchers from both Political Science and Computer Science. Our initial experiments demonstrate how the linguistic and institutional annotations in ToN can be used to gather insights on how different aspects of the political process affect classification.

Bidragsytere

Emanuele Lapponi

  • Tilknyttet:
    Forfatter
    ved Forskningsgruppen for språkteknologi ved Universitetet i Oslo
Aktiv cristin-person

Martin Søyland

Bidragsyterens navn vises på dette resultatet som Martin G. Søyland
  • Tilknyttet:
    Forfatter
    ved Institutt for Statsvitenskap ved Universitetet i Oslo

Erik Velldal

  • Tilknyttet:
    Forfatter
    ved Forskningsgruppen for språkteknologi ved Universitetet i Oslo

Stephan Oepen

  • Tilknyttet:
    Forfatter
    ved Forskningsgruppen for språkteknologi ved Universitetet i Oslo
1 - 4 av 4