Cristin-resultat-ID: 1372560
Sist endret: 10. april 2017 16:04
NVI-rapporteringsår: 2016
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2016

NorGramBank: A ‘Deep’ Treebank for Norwegian

Bidragsytere:
  • Helge J. Jakhelln Dyvik
  • Paul Meurer
  • Victoria Rosén
  • Koenraad De Smedt
  • Petter Haugereid
  • Gyri Smørdal Losnegaard
  • mfl.

Bok

Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016)
ISBN:
  • 978-2-9517408-9-1

Utgiver

European Language Resources Association
NVI-nivå 1

Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2016
Sider: 3555 - 3562
ISBN:
  • 978-2-9517408-9-1

Klassifisering

Fagfelt (NPI)

Fagfelt: Nordisk
- Fagområde: Humaniora

Beskrivelse Beskrivelse

Tittel

NorGramBank: A ‘Deep’ Treebank for Norwegian

Sammendrag

We present NorGramBank, a treebank for Norwegian with highly detailed LFG analyses. It is one of many treebanks made available through the INESS treebanking infrastructure. NorGramBank was constructed as a parsebank, i.e. by automatically parsing a corpus, using the wide coverage grammar NorGram. One part consisting of 350,000 words has been manually disambiguated using computer-generated discriminants. A larger part of 50 M words has been stochastically disambiguated. The treebank is dynamic: by global reparsing at certain intervals it is kept compatible with the latest versions of the grammar and the lexicon, which are continually further developed in interaction with the annotators. A powerful query language, INESS Search, has been developed for search across formalisms in the INESS treebanks, including LFG c- and f-structures. Evaluation shows that the grammar provides about 85% of randomly selected sentences with good analyses. Agreement among the annotators responsible for manual disambiguation is satisfactory, but also suggests desirable simplifications of the grammar.

Bidragsytere

Helge Julius Jakhelln Dyvik

Bidragsyterens navn vises på dette resultatet som Helge J. Jakhelln Dyvik
  • Tilknyttet:
    Forfatter
    ved Institutt for lingvistiske, litterære og estetiske studier ved Universitetet i Bergen

Paul Meurer

  • Tilknyttet:
    Forfatter
    ved NORCE Teknologi ved NORCE Norwegian Research Centre AS

Victoria Rosén

  • Tilknyttet:
    Forfatter
    ved Institutt for lingvistiske, litterære og estetiske studier ved Universitetet i Bergen
Aktiv cristin-person

Koenraad De Smedt

  • Tilknyttet:
    Forfatter
    ved Institutt for lingvistiske, litterære og estetiske studier ved Universitetet i Bergen

Petter Haugereid

  • Tilknyttet:
    Forfatter
    ved Institutt for lingvistiske, litterære og estetiske studier ved Universitetet i Bergen
1 - 5 av 8 | Neste | Siste »

Resultatet er en del av Resultatet er en del av

Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016).

Calzolari, Nicoletta; Choukri, Khalid; Declerck, Thierry; Grobelnik, Marko; Maegaard, Bente; Mariani, Joseph; Moreno, Asunción; Odijk, Jan; Piperidis, Stelios. 2016, European Language Resources Association. HELLAS, CNR, SLOVENIA, KU, TYSKLAND, UPdC, NEDERLAND, FRANKRIKEVitenskapelig antologi/Konferanseserie
1 - 1 av 1