Cristin-resultat-ID: 1912501
Sist endret: 6. februar 2023, 12:58
NVI-rapporteringsår: 2021
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2021

Synthetic Data For Dnn-Based Doa Estimation of Indoor Speech

Bidragsytere:
  • Femke B. Gelderblom
  • Yi Liu
  • Johannes Kvam og
  • Tor Andre Myrvoll

Bok

ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
ISBN:
  • 978-1-7281-7606-2

Utgiver

IEEE (Institute of Electrical and Electronics Engineers)
NVI-nivå 1

Serie

Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
ISSN 1520-6149
e-ISSN 2379-190X
NVI-nivå 1

Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2021
Hefte: 2021
Sider: 4390 - 4394
ISBN:
  • 978-1-7281-7606-2
Open Access

Klassifisering

Fagfelt (NPI)

Fagfelt: IKT
- Fagområde: Realfag og teknologi

Beskrivelse Beskrivelse

Tittel

Synthetic Data For Dnn-Based Doa Estimation of Indoor Speech

Sammendrag

This paper investigates the use of different room impulse response (RIR) simulation methods for synthesizing training data for deep neural network-based direction of arrival (DOA) estimation of speech in reverberant rooms. Different sets of synthetic RIRs are obtained using the image source method (ISM) and more advanced methods including diffuse reflections and/or source directivity. Multi-layer perceptron (MLP) deep neural network (DNN) models are trained on generalized cross correlation (GCC) features extracted for each set. Finally, models are tested on features obtained from measured RIRs. This study shows the importance of training with RIRs from directive sources, as resultant DOA models achieved up to 51% error reduction compared to the steered response power with phase transform (SRP-PHAT) baseline (significant with p

Bidragsytere

Femke Berre Gelderblom

Bidragsyterens navn vises på dette resultatet som Femke B. Gelderblom
  • Tilknyttet:
    Forfatter
    ved Institutt for elektroniske systemer ved Norges teknisk-naturvitenskapelige universitet
  • Tilknyttet:
    Forfatter
    ved Sustainable Communication Technologies ved SINTEF AS

Yi Liu

  • Tilknyttet:
    Forfatter
    ved Sustainable Communication Technologies ved SINTEF AS

Johannes Kvam

  • Tilknyttet:
    Forfatter
    ved Smart Sensors and Microsystems ved SINTEF AS

Tor Andre Myrvoll

  • Tilknyttet:
    Forfatter
    ved Sustainable Communication Technologies ved SINTEF AS
  • Tilknyttet:
    Forfatter
    ved Institutt for elektroniske systemer ved Norges teknisk-naturvitenskapelige universitet
1 - 4 av 4

Resultatet er en del av Resultatet er en del av

ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) .

Androutsos, Dimitri; Plataniotis, Kostas; Zhang, Xiao-Ping. 2021, IEEE (Institute of Electrical and Electronics Engineers). Vitenskapelig antologi/Konferanseserie
1 - 1 av 1