Info
Meny
English
Logg inn
Søk etter prosjekter, resultater og personer
Søk etter prosjekter, resultater og personer
Historikk
Cristin-resultat-ID:
1912501
Sist endret:
6. februar 2023, 12:58
NVI-rapporteringsår:
2021
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2021
Synthetic Data For Dnn-Based Doa Estimation of Indoor Speech
Femke B. Gelderblom
Yi Liu
Johannes Kvam
og
Tor Andre Myrvoll
Bok
Bok
ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
ISBN:
978-1-7281-7606-2
Utgiver
IEEE (Institute of Electrical and Electronics Engineers)
NVI-nivå 1
Finn i kanalregisteret
Serie
Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
ISSN 1520-6149
e-ISSN 2379-190X
NVI-nivå 1
Finn i kanalregisteret
Om resultatet
Om resultatet
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2021
Hefte: 2021
Sider: 4390 - 4394
ISBN:
978-1-7281-7606-2
Open Access
Lenker
Lenker
original online (doi)
https://doi.org/10.1109/ICASSP39728.2021.9414415
ORIA
Søk i ORIA med 978-1-7281-7606-2
Institusjonsarkiv
hdl.handle.net/11250/2824872
Klassifisering
Klassifisering
Fagfelt (NPI)
Fagfelt: IKT
- Fagområde: Realfag og teknologi
Beskrivelse
Beskrivelse
Engelsk
Tittel
Synthetic Data For Dnn-Based Doa Estimation of Indoor Speech
Sammendrag
This paper investigates the use of different room impulse response (RIR) simulation methods for synthesizing training data for deep neural network-based direction of arrival (DOA) estimation of speech in reverberant rooms. Different sets of synthetic RIRs are obtained using the image source method (ISM) and more advanced methods including diffuse reflections and/or source directivity. Multi-layer perceptron (MLP) deep neural network (DNN) models are trained on generalized cross correlation (GCC) features extracted for each set. Finally, models are tested on features obtained from measured RIRs. This study shows the importance of training with RIRs from directive sources, as resultant DOA models achieved up to 51% error reduction compared to the steered response power with phase transform (SRP-PHAT) baseline (significant with p
Vis
fullstendig beskrivelse
Bidragsytere
Bidragsytere
Femke Berre Gelderblom
Bidragsyterens navn vises på dette resultatet som Femke B. Gelderblom
Forfatter
ved Institutt for elektroniske systemer ved Norges teknisk-naturvitenskapelige universitet
Forfatter
ved Sustainable Communication Technologies ved SINTEF AS
Yi Liu
Forfatter
ved Sustainable Communication Technologies ved SINTEF AS
Johannes Kvam
Forfatter
ved Smart Sensors and Microsystems ved SINTEF AS
Tor Andre Myrvoll
Forfatter
ved Sustainable Communication Technologies ved SINTEF AS
Forfatter
ved Institutt for elektroniske systemer ved Norges teknisk-naturvitenskapelige universitet
1
-
4
av
4
Resultatet er en del av
Resultatet er en del av
ICASSP 2021 - 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) .
Androutsos, Dimitri; Plataniotis, Kostas; Zhang, Xiao-Ping. 2021, IEEE (Institute of Electrical and Electronics Engineers).
Vitenskapelig antologi/Konferanseserie
1
-
1
av
1