Cristin-resultat-ID: 1987011
Sist endret: 9. februar 2022, 09:37
NVI-rapporteringsår: 2021
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2021

Approximating a deep reinforcement learning docking agent using linear model trees

Bidragsytere:
  • Vilde Benoni Gjærum
  • Ella-Lovise Hammervold Rørvik og
  • Anastasios M. Lekkas

Bok

Proceedings of the 2021 European Control Conference
ISBN:
  • 978-9-4638-4236-5

Utgiver

IEEE conference proceedings
NVI-nivå 1

Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2021
Sider: 1465 - 1471
ISBN:
  • 978-9-4638-4236-5

Klassifisering

Fagfelt (NPI)

Fagfelt: IKT
- Fagområde: Realfag og teknologi

Beskrivelse Beskrivelse

Tittel

Approximating a deep reinforcement learning docking agent using linear model trees

Sammendrag

Deep reinforcement learning has led to numerous notable results in robotics. However, deep neural networks (DNNs) are unintuitive, which makes it difficult to understand their predictions and strongly limits their potential for realworld applications due to economic, safety, and assurance reasons. To remedy this problem, a number of explainable AI methods have been presented, such as SHAP and LIME, but these can be either be too costly to be used in real-time robotic applications or provide only local explanations. In this paper, the main contribution is the use of a linear model tree (LMT) to approximate a DNN policy, originally trained via proximal policy optimization(PPO), for an autonomous surface vehicle with five control inputs performing a docking operation. The two main benefits of the proposed approach are: a) LMTs are transparent which makes it possible to associate directly the outputs (control actions, in our case) with specific values of the input features, b) LMTs are computationally efficient and can provide information in real-time. In our simulations, the opaque DNN policy controls the vehicle and the LMT runs in parallel to provide explanations in the form of feature attributions. Our results indicate that LMTs can be a useful component within digital assurance frameworks for autonomous ships.

Bidragsytere

Vilde Benoni Gjærum

  • Tilknyttet:
    Forfatter
    ved Institutt for teknisk kybernetikk ved Norges teknisk-naturvitenskapelige universitet

Ella-Lovise Hammervold Rørvik

  • Tilknyttet:
    Forfatter
    ved Aneo

Anastasios Lekkas

Bidragsyterens navn vises på dette resultatet som Anastasios M. Lekkas
  • Tilknyttet:
    Forfatter
    ved Institutt for teknisk kybernetikk ved Norges teknisk-naturvitenskapelige universitet
1 - 3 av 3

Resultatet er en del av Resultatet er en del av

Proceedings of the 2021 European Control Conference.

Ferrara, Antonella. 2021, IEEE conference proceedings. Vitenskapelig antologi/Konferanseserie
1 - 1 av 1