Info
Meny
English
Logg inn
Søk etter prosjekter, resultater og personer
Søk etter prosjekter, resultater og personer
Historikk
Cristin-resultat-ID:
1359276
Sist endret:
13. februar 2017, 18:34
NVI-rapporteringsår:
2016
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2016
OpenSubtitles2016: Extracting Large Parallel Corpora from Movie and TV Subtitles
Pierre Lison
og
Jörg Tiedemann
Bok
Bok
Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016)
ISBN:
978-2-9517408-9-1
Utgiver
European Language Resources Association
NVI-nivå 1
Finn i kanalregisteret
Om resultatet
Om resultatet
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2016
Sider: 923 - 929
ISBN:
978-2-9517408-9-1
Open Access
Lenker
Lenker
ORIA
Søk i ORIA med 978-2-9517408-9-1
Institusjonsarkiv
hdl.handle.net/10852/50459
Klassifisering
Klassifisering
Fagfelt (NPI)
Fagfelt: Medier og kommunikasjon
- Fagområde: Humaniora
Beskrivelse
Beskrivelse
Engelsk
Tittel
OpenSubtitles2016: Extracting Large Parallel Corpora from Movie and TV Subtitles
Sammendrag
We present a new major release of the OpenSubtitles collection of parallel corpora. The release is compiled from a large database of movie and TV subtitles and includes a total of 1689 bitexts spanning 2.6 billion sentences across 60 languages. The release also incorporates a number of enhancements in the preprocessing and alignment of the subtitles, such as the automatic correction of OCR errors and the use of meta-data to estimate the quality of each subtitle and score subtitle pairs.
Vis
fullstendig beskrivelse
Bidragsytere
Bidragsytere
Pierre Lison
Forfatter
ved Forskningsgruppen for språkteknologi ved Universitetet i Oslo
Jörg Tiedemann
Forfatter
ved Helsingin yliopisto / Helsingfors universitet
1
-
2
av
2
Tilknyttede prosjekter
Tilknyttede prosjekter
Dialogue Modelling for Statistical Machine Translation
Pierre Lison
Forskningsgruppen for språkteknologi ved Universitetet i Oslo
19 resultater
Avsluttet prosjekt
1
-
1
av
1
Resultatet er en del av
Resultatet er en del av
Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016).
Calzolari, Nicoletta; Choukri, Khalid; Declerck, Thierry; Grobelnik, Marko; Maegaard, Bente; Mariani, Joseph; Moreno, Asunción; Odijk, Jan; Piperidis, Stelios. 2016, European Language Resources Association. HELLAS, CNR, SLOVENIA, UPC, KU, TYSKLAND, NEDERLAND, FRANKRIKE
Vitenskapelig antologi/Konferanseserie
1
-
1
av
1