Historikk

Cristin-resultat-ID: 2205633

Sist endret: 27. februar 2024, 09:35

NVI-rapporteringsår: 2023

Resultat

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2023

Unsupervised State Representation Learning in Partially Observable Atari Games

Li Meng
Morten Goodwin
Anis Yazidi og
Paal E. Engelstad

Bok Bok

Computer Analysis of Images and Patterns. CAIP 2023

ISBN:

978-3-031-44239-1

Utgiver

Springer

NVI-nivå 1

Finn i kanalregisteret

Serie

Lecture Notes in Computer Science (LNCS)

ISSN 0302-9743
e-ISSN 1611-3349

NVI-nivå 1

Finn i kanalregisteret

Om resultatet Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Publiseringsår: 2023

Volum: 14185

Hefte: 2023

Sider: 212 - 222

ISBN:

978-3-031-44239-1

Open Access

Lenker Lenker

Klassifisering Klassifisering

Fagfelt (NPI)

Fagfelt: IKT

- Fagområde: Realfag og teknologi

Beskrivelse Beskrivelse

Engelsk

Tittel

Unsupervised State Representation Learning in Partially Observable Atari Games

Sammendrag

State representation learning aims to capture latent factors of an environment. Although some researchers realize the connections between masked image modeling and contrastive representation learning, the effort is focused on using masks as an augmentation technique to represent the latent generative factors better. Partially observable environments in reinforcement learning have not yet been carefully studied using unsupervised state representation learning methods. In this article, we create an unsupervised state representation learning scheme for partially observable states. We conducted our experiment on a previous Atari 2600 framework designed to evaluate representation learning models. A contrastive method called Spatiotemporal DeepInfomax (ST-DIM) has shown state-of-the-art performance on this benchmark but remains inferior to its supervised counterpart. Our approach improves ST-DIM when the environment is not fully observable and achieves higher F1 scores and accuracy scores than the supervised learning counterpart. The mean accuracy score averaged over categories of our approach is 66%, compared to 38% of supervised learning. The mean F1 score is 64% to 33%. The code can be found on https://github.com/mengli11235/MST_DIM.

Vis fullstendig beskrivelse

Bidragsytere Bidragsytere

Li Meng

Forfatter
ved Seksjon for autonome systemer og sensorteknologier ved Universitetet i Oslo

Morten Goodwin

Forfatter
ved Institutt for informasjonsteknologi ved OsloMet - storbyuniversitetet
Forfatter
ved Institutt for informasjons- og kommunikasjonsteknologi ved Universitetet i Agder

Anis Yazidi

Forfatter
ved Institutt for informasjonsteknologi ved OsloMet - storbyuniversitetet

Paal Engelstad

Bidragsyterens navn vises på dette resultatet som Paal E. Engelstad

Forfatter
ved Seksjon for autonome systemer og sensorteknologier ved Universitetet i Oslo

1 - 4 av 4

Resultatet er en del av Resultatet er en del av

Computer Analysis of Images and Patterns. CAIP 2023.

Tsapatsoulis, Nicolas. 2023, Springer. CUTVitenskapelig antologi/Konferanseserie

1 - 1 av 1

Historikk

Unsupervised State Representation Learning in Partially Observable Atari Games

Bok Bok

Utgiver

Serie

Om resultatet Om resultatet

Lenker Lenker

original online (doi)

ORIA

Institusjonsarkiv

Klassifisering Klassifisering

Fagfelt (NPI)

Beskrivelse Beskrivelse

Tittel

Sammendrag

Bidragsytere Bidragsytere

Li Meng

Morten Goodwin

Anis Yazidi

Paal Engelstad

Resultatet er en del av Resultatet er en del av

Computer Analysis of Images and Patterns. CAIP 2023.