Cristin-resultat-ID: 1935475
Sist endret: 17. september 2021, 14:44
Resultat
Mastergradsoppgave
2021

Unsupervised methods for in-situ classification of plankton taxa

Bidragsytere:
  • Eivind Salvesen

Utgiver/serie

Utgiver

Fakultet for informasjonsteknologi og elektroteknikk, Institutt for teknisk kybernetikk, NTNU

Om resultatet

Mastergradsoppgave
Publiseringsår: 2021
Antall sider: 140

Klassifisering

Vitenskapsdisipliner

Informasjons- og kommunikasjonsteknologi

Emneord

Deep learning • Ikke veildedede maskinlæringsalgoritmer • Maskinlæring

Fagfelt (NPI)

Fagfelt: Elektronikk og kybernetikk
- Fagområde: Realfag og teknologi

Beskrivelse Beskrivelse

Tittel

Unsupervised methods for in-situ classification of plankton taxa

Sammendrag

Planktonic species are of great importance in the marine ecosystem, standing for about half of the earth's primary production and being a fundamental part of the marine food chain. Yet, our understanding of these vital creatures and the consequences of small changes in their habitats, creating profound shifts in planktonic dispersion and abundance, is still limited. Recent development and innovation within autonomous underwater vehicles (AUV) makes it possible to utilize AUVs for in-situ identification and classification of plankton taxa resulting in faster and more reliable calculations of its distributions than any existing sampling and classification platform. For accurate image classification, the system is heavily dependent on accurate and attested machine learning techniques. Currently, deep convolutional neural networks have proven especially effective for this task. Yet, the success is fixed to supervised learning, which requires an extensive amount of labeled training data. Such methods thus require a comprehensive and time-consuming labeling effort. The scope of this work is to make a deep learning framework for plankton classification training on images that contain no ground truth labels. This work extends the work of the specialization project by proposing new feature extraction methods using state of the art unsupervised training schemes. These models can then be used to extract features that can improve a separate clustering algorithm. For comparison to the specialization project, the models are tested over existing planktonic data sets. The most successful methods are then adapted onto the image data acquired from the AUV missions in the Trondheim fjord. Three methods for improved feature learning, DeepCluster [15], a generative adversarial network (GAN) model and a rotation-invariant autoencoder were selected for this thesis. The former two were chosen as they represent some promising new directions within the unsupervised deep learning and have shown recent success at learning essential features on large image data sets. The rotation invariant autoencoder is an extension of a conventional autoencoder, which is more robust to similar class objects with different rotations. The proposed methods were then used as feature extractors to significantly improve different clustering algorithms in regards to classification performance over planktonic data. The chosen methods demonstrate some of the possibilities within the unsupervised domain, but the gap towards supervised learning is still significant.

Tittel

Uovervåket metoder for in-situ klassifisering av plankton taxa

Sammendrag

Plankton spiller en enormt viktig rolle i marine økosystemer. De står for om lag halvparten av jordens primærproduksjon i tillegg til å være en fundamental brikke i den marine næringskjeden. Vår forståelse av disse viktige skapningene og konsekvensene av små endringer i deres habitat som forårsaker store endringer i plankton spredning og tallrikhet er likevel liten. Nyskapning innen autonome undervannsfarkoster (AUV) for in-situ identifikasjon og klassifikasjon av plankton arter kan gi raskere og mer pålitelige beregninger av deres utbredelse og fordeling enn eksisterende prøvetaknings og klassifikasjonsplattformer. For nøyaktig klassifisering av tusenvis av bilder, kreves nøyaktige og utprøvde maskinlæringsmetoder. For øyeblikket har convolutional neural networks (CNN) demonstrert at de er spesielt effektive innenfor slike oppgaver. Suksessen er likevel kun knyttet til veiledet (supervised) læring som krever store mengder inndata-utdata par hvor merkingen av inndataen er veldig arbeids og tidskrevende. Dette arbeidets omfang er å lage et dypt lærings rammeverk for klassifikasjon av plankton uten å benytte forhåndsmerket data. Arbeidet videreutvikler resultatene gjort fra spesialiseringsprosjektet ved å introdusere nye metoder for å lære viktige trekk ved plankton arter ved hjelp av ikke veiledet (unsupervised) læring. Disse metodene kan deretter brukes til å hente ut de viktigste trekkene ved hvert bilde for slik å forbedre treffsikkerheten til ulike grupperingsalgoritmer. For å kunne sammenligne modellene brukt i spesialiseringsprosjektet er metodene testet over eksisterende plankton datasett. De beste metodene er deretter tilpasset dataene hentet fra AUV ekspidisjonene i Trondheimsfjorden. Tre metoder for forbedret læring over plankton data, DeepCluster [15], et generative adversarial network (GAN) nettverk og en rotation-invariant autoencoder, er valgt ut til denne oppgaven. De to førstnevnte ble valgt ut ettersom de representerer lovende nye retninger innen ikke veiledet læring og har vist seg kapable til å lære viktige trekk ved bilder fra en rekke store datasett. The rotation invariant autoencoder er en utvidelse av de tidligere utprøvde autoencoderne med bedre egenskaper i forhold til roterte bilder fra samme objektklassse. De foreslåtte metodene er brukt til å forbedre ulike grupperingsalgoritmer. Metodene demonstrerer noen av mulighetene innen ikke veiledet læring, men avstanden til veiledete algoritmer er fortsatt betydelig.

Bidragsytere

Eivind Salvesen

  • Tilknyttet:
    Forfatter
    ved Institutt for teknisk kybernetikk ved Norges teknisk-naturvitenskapelige universitet

Annette Stahl

  • Tilknyttet:
    Veileder
    ved Institutt for teknisk kybernetikk ved Norges teknisk-naturvitenskapelige universitet

Aya Saad

  • Tilknyttet:
    Veileder
    ved Institutt for teknisk kybernetikk ved Norges teknisk-naturvitenskapelige universitet
1 - 3 av 3