Cristin-prosjekt-ID: 2239265
Sist endret: 17. juli 2020 17:52

Cristin-prosjekt-ID: 2239265
Sist endret: 17. juli 2020 17:52
Prosjekt

Graph-based Neural Models for Dialogue Management

prosjektleder

Pierre Lison
ved Statistisk analyse, maskinlæring og bildeanalyse SAMBA ved Norsk Regnesentral

prosjekteier / koordinerende forskningsansvarlig enhet

  • Norsk Regnesentral

Klassifisering

Vitenskapsdisipliner

Annen informasjonsteknologi • Informasjons- og kommunikasjonsteknologi

Emneord

Språkteknologi • Maskinlæring • Robotikk

Kategorier

Prosjektkategori

  • Grunnforskning

Kontaktinformasjon

Telefon
96799812
Sted
Pierre Lison

Tidsramme

Aktivt
Start: 1. juli 2020 Slutt: 30. juni 2024

Beskrivelse Beskrivelse

Tittel

Graph-based Neural Models for Dialogue Management

Populærvitenskapelig sammendrag

Talespråk er en naturlig form for kommunikasjon mellom mennesker. Siden vi ble født har vi alle lært hvordan språk brukes til å kommunisere med hverandre, og mye av hverdagen vår tilbringes i samtaler. Bruken av språk som kommunikasjonsmedium mellom mennesker og maskiner har gitt opphav til teknologier som virtuelle assistenter (som Siri, Cortana, Google Home eller Amazon Echo), stemmekontroll i bilen og snakkende roboter.

Disse dataprogrammene er alle eksempler på (talebaserte) dialogsystemer. Inne i disse systemene er det en modul kalt dialogstyreren (dialogue manager) som er ansvarlig for å ta beslutninger om hva systemet skal si eller gjøre på et gitt tidspunkt (for eksempel å svare brukeren eller utføre en bevegelse). For å ta disse beslutningene, registrerer dialogstyreren hva systemet vet om samtalen i en datastruktur kalt "dialogtilstanden".

Dialogstyrere er ofte utviklet med hjelp av maskinlæringsmetoder (for eksempel dype nevrale nettverk) og trent på samtaledata. Nåværende modeller har imidlertid flere begrensninger. Den første er at de begrenser dialogtilstanden til et fast, forhåndsdefinert sett tilstandvariabler, noe som gjør det vanskelig å representere sammensatte kontekster som utvikler seg over tid. For det andre er disse modellene avhengige av store datamengder for å lære nyttig atferd. Dette er problematisk for applikasjoner der data er knappe og dyre å samle inn.

GraphDial vil undersøke en alternativ tilnærming til dialogstyring basert på grafer som kjernerepresentasjon for dialogtilstanden. Grafer er godt egnet til å registrere komplekse interaksjoner som inkluderer flere enheter (for eksempel steder, personer, objekter, oppgaver eller ytringer) og forholdene dem i mellom. Videre vil GraphDial også jobbe med bruk av svakt tilsyn (weak supervision) for dialogstyring. Svakt tilsyn er et gryende paradigme innen AI og har som formål å gi maskinlæringsmodeller indirekte treningsdata hentet fra regelsett eller domenekunnskap.

Vitenskapelig sammendrag

The GraphDial project sets out to advance the state-of-the-art in dialogue management. Current approaches to dialogue management often make use of neural models trained on dialogue data using supervised or reinforcement learning. These approaches have led to enhanced performance across a broad range of tasks, but also have two important shortcomings:

(1) They rely on quite restrictive representations of the dialogue state (often based on fixed numbers of slots to fill);

(2) They are dependent on large amounts of training data to learn the model parameters.

The project will investigate an alternative approach to dialogue management based on the use of probabilistic graphs as core representation for the dialogue state. Graphs are well suited to capture rich interaction contexts including multiple entities and relations. They also facilitate the use of relational abstractions covering large portions of the state space in a compact and human-readable manner.

Another central topic for the project is the use of weak supervision to train neural models for dialogue state tracking and action selection. Weak supervision allows machine learning models to be trained with indirect data extracted from noisy labelling functions or domain knowledge. The use of weak supervision is particularly attractive for dialogue management due to the difficulty of obtaining annotated data in most dialogue domains. The project intends to integrate a range of weak supervision signals, including user responses to grounding or clarification acts, heuristic rules and global constraints on the graph structure.

To achieve these objectives, GraphDial will feature collaborations with leading researchers in the field of spoken dialogue systems, statistical relational learning, graph neural networks and human-robot interaction. The project will also be in contact with two Norwegian companies involved in the development of conversational technology to facilitate the dissemination of project results.

prosjektdeltakere

prosjektleder
Aktiv cristin-person

Pierre Lison

  • Tilknyttet:
    Prosjektleder
    ved Statistisk analyse, maskinlæring og bildeanalyse SAMBA ved Norsk Regnesentral

Stephan Oepen

  • Tilknyttet:
    Prosjektdeltaker
    ved ML Maskinlæring ved Universitetet i Oslo

Martijn van Otterlo

  • Tilknyttet:
    Prosjektdeltaker
    ved Open Universiteit Nederland

Filippo Maria Bianchi

  • Tilknyttet:
    Prosjektdeltaker
    ved NORCE Teknologi ved NORCE Norwegian Research Centre AS

Kristiina Jokinen

  • Tilknyttet:
    Prosjektdeltaker
    ved National Institute of Advanced Industrial Science and Technology
1 - 5 av 6 | Neste | Siste »