Cristin-resultat-ID: 54441
Sist endret: 21. januar 2015, 15:06
NVI-rapporteringsår: 2006
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2006

Log Likelihood Ratio Based Annotation Verification of a Norwegian Speech Synthesis Database

Bidragsytere:
  • Ingunn Amdal
  • Magne Hallstein Johnsen og
  • Torbjørn Svendsen

Bok

Proceedings of the 7th Nordic Signal Processing Symposium (NORSIG 2006)
ISBN:
  • 1-4244-0413-4

Utgiver

IEEE conference proceedings
NVI-nivå 1

Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2006
Antall sider: 4
ISBN:
  • 1-4244-0413-4

Beskrivelse Beskrivelse

Tittel

Log Likelihood Ratio Based Annotation Verification of a Norwegian Speech Synthesis Database

Sammendrag

Accurate labeling and segmentation of the unit inventory database is of vital importance to the quality of unit selection text-to-speech synthesis. Misalignments and mismatch between the predicted and pronounced unit sequences require manual correction to achieve natural sounding synthesis. In this paper we have used a log likelihood ratio based utterance verification to automatically detect annotation errors in a Norwegian two-speaker synthesis database. Each sentence is assigned a confidence score and those falling below a threshold can be discarded or manually inspected and corrected. Using equal reject number as a criterion the transcription sentence error rate was reduced from 9.8% to 2.7%. Insertions are the largest error category, and 95.6% of these were detected. A closer inspection of false rejections was performed to assess (and improve) the phoneme prediction system.

Bidragsytere

Ingunn Amdal

  • Tilknyttet:
    Forfatter
    ved Institutt for elektroniske systemer ved Norges teknisk-naturvitenskapelige universitet

Magne Hallstein Johnsen

  • Tilknyttet:
    Forfatter
    ved Institutt for elektroniske systemer ved Norges teknisk-naturvitenskapelige universitet

Torbjørn Karl Svendsen

Bidragsyterens navn vises på dette resultatet som Torbjørn Svendsen
  • Tilknyttet:
    Forfatter
    ved Institutt for elektroniske systemer ved Norges teknisk-naturvitenskapelige universitet
1 - 3 av 3

Resultatet er en del av Resultatet er en del av

Proceedings of the 7th Nordic Signal Processing Symposium (NORSIG 2006).

Sveinsson, Jóhannes R.. 2006, IEEE conference proceedings. Vitenskapelig antologi/Konferanseserie
1 - 1 av 1