Cristin-resultat-ID: 2170874
Sist endret: 18. september 2023, 10:44
NVI-rapporteringsår: 2023
Resultat
Vitenskapelig artikkel
2023

Analysis of Deep Convolutional Neural Networks Using Tensor Kernels and Matrix-Based Entropy

Bidragsytere:
  • Kristoffer Wickstrøm
  • Sigurd Eivindson Løkse
  • Michael Kampffmeyer
  • Shujian Yu
  • José C. Príncipe og
  • Robert Jenssen

Tidsskrift

Entropy
ISSN 1099-4300
e-ISSN 1099-4300
NVI-nivå 1

Om resultatet

Vitenskapelig artikkel
Publiseringsår: 2023
Volum: 25
Hefte: 6
Sider: 1 - 21
Open Access

Importkilder

Scopus-ID: 2-s2.0-85163873094

Klassifisering

Vitenskapsdisipliner

Informasjons- og kommunikasjonsvitenskap • Matematikk og naturvitenskap • Matematisk modellering og numeriske metoder

Emneord

Informasjonsteori • Kjernemetoder • Dyp læring

Beskrivelse Beskrivelse

Tittel

Analysis of Deep Convolutional Neural Networks Using Tensor Kernels and Matrix-Based Entropy

Sammendrag

Analyzing deep neural networks (DNNs) via information plane (IP) theory has gained tremendous attention recently to gain insight into, among others, DNNs’ generalization ability. However, it is by no means obvious how to estimate the mutual information (MI) between each hidden layer and the input/desired output to construct the IP. For instance, hidden layers with many neurons require MI estimators with robustness toward the high dimensionality associated with such layers. MI estimators should also be able to handle convolutional layers while at the same time being computationally tractable to scale to large networks. Existing IP methods have not been able to study truly deep convolutional neural networks (CNNs). We propose an IP analysis using the new matrix-based Rényi’s entropy coupled with tensor kernels, leveraging the power of kernel methods to represent properties of the probability distribution independently of the dimensionality of the data. Our results shed new light on previous studies concerning small-scale DNNs using a completely new approach. We provide a comprehensive IP analysis of large-scale CNNs, investigating the different training phases and providing new insights into the training dynamics of large-scale neural networks.

Bidragsytere

Kristoffer Knutsen Wickstrøm

Bidragsyterens navn vises på dette resultatet som Kristoffer Wickstrøm
  • Tilknyttet:
    Forfatter
    ved Institutt for fysikk og teknologi ved UiT Norges arktiske universitet

Sigurd Eivindson Løkse

  • Tilknyttet:
    Forfatter
    ved Institutt for fysikk og teknologi ved UiT Norges arktiske universitet

Michael Christian Kampffmeyer

Bidragsyterens navn vises på dette resultatet som Michael Kampffmeyer
  • Tilknyttet:
    Forfatter
    ved Institutt for fysikk og teknologi ved UiT Norges arktiske universitet
  • Tilknyttet:
    Forfatter
    ved Avdeling for bildeanalyse, maskinlæring og jordobservasjon BAMJO ved Norsk Regnesentral

Shujian Yu

  • Tilknyttet:
    Forfatter
    ved University of Florida
  • Tilknyttet:
    Forfatter
    ved Vrije Universiteit Amsterdam
  • Tilknyttet:
    Forfatter
    ved Institutt for fysikk og teknologi ved UiT Norges arktiske universitet

José C. Príncipe

  • Tilknyttet:
    Forfatter
    ved University of Florida
1 - 5 av 6 | Neste | Siste »