Cristin-resultat-ID: 1915932
Sist endret: 28. mars 2022, 11:10
NVI-rapporteringsår: 2021
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2021

NorDial: A Preliminary Corpus of Written Norwegian Dialect Use

Bidragsytere:
  • Jeremy Barnes
  • Petter Mæhlum og
  • Samia Touileb

Bok

Proceedings of the 23rd Nordic Conference on Computational Linguistics (NoDaLiDa)
ISBN:
  • 978-91-7929-614-8

Utgiver

Linköping University Electronic Press
NVI-nivå 1

Serie

Linköping Electronic Conference Proceedings
ISSN 1650-3686
e-ISSN 1650-3740
NVI-nivå 1

Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2021
Hefte: 178
Sider: 445 - 451
ISBN:
  • 978-91-7929-614-8

Klassifisering

Fagfelt (NPI)

Fagfelt: Tverrfaglig teknologi
- Fagområde: Realfag og teknologi

Beskrivelse Beskrivelse

Tittel

NorDial: A Preliminary Corpus of Written Norwegian Dialect Use

Sammendrag

Norway has a large amount of dialectal variation, as well as a general tolerance to its use in the public sphere. There are, however, few available resources to study this variation and its change over time and in more informal areas, on social media. In this paper, we propose a first step to creating a corpus of dialectal variation of written Norwegian. We collect a small corpus of tweets and manually annotate them as Bokmål, Nynorsk, any dialect, or a mix. We further perform preliminary experiments with state-of-the-art models, as well as an analysis of the data to expand this corpus in the future. Finally, we make the annotations available for future work.

Bidragsytere

Jeremy Claude Barnes

Bidragsyterens navn vises på dette resultatet som Jeremy Barnes
  • Tilknyttet:
    Forfatter
    ved Språkteknologigruppen ved Universitetet i Oslo

Petter Mæhlum

  • Tilknyttet:
    Forfatter
    ved Språkteknologigruppen ved Universitetet i Oslo

Samia Touileb

  • Tilknyttet:
    Forfatter
    ved Språkteknologigruppen ved Universitetet i Oslo
1 - 3 av 3

Resultatet er en del av Resultatet er en del av

Proceedings of the 23rd Nordic Conference on Computational Linguistics (NoDaLiDa).

Dobnik, Simon; Øvrelid, Lilja. 2021, Linköping University Electronic Press. UIOVitenskapelig antologi/Konferanseserie
1 - 1 av 1