Cristin-resultat-ID: 2177673
Sist endret: 8. februar 2024, 14:13
NVI-rapporteringsår: 2023
Resultat
Vitenskapelig artikkel
2023

Learning Horn envelopes via queries from language models

Bidragsytere:
  • Sophie Blum
  • Raoul Koudijs
  • Ana Ozaki og
  • Samia Touileb

Tidsskrift

International Journal of Approximate Reasoning
ISSN 0888-613X
e-ISSN 1873-4731
NVI-nivå 2

Om resultatet

Vitenskapelig artikkel
Publiseringsår: 2023
Artikkelnummer: 109026
Open Access

Importkilder

Scopus-ID: 2-s2.0-85173120411

Beskrivelse Beskrivelse

Tittel

Learning Horn envelopes via queries from language models

Sammendrag

We present an approach for systematically probing a trained neural network to extract a symbolic abstraction of it, represented as a Boolean formula. We formulate this task within Angluin's exact learning framework, where a learner attempts to extract information from an oracle (in our work, the neural network) by posing membership and equivalence queries. We adapt Angluin's algorithm for Horn formula to the case where the examples are labelled w.r.t. an arbitrary Boolean formula in CNF (rather than a Horn formula). In this setting, the goal is to learn the smallest representation of all the Horn clauses implied by a Boolean formula—called its Horn envelope—which in our case correspond to the rules obeyed by the network. Our algorithm terminates in exponential time in the worst case and in polynomial time if the target Boolean formula can be closely approximated by its envelope. We also show that extracting Horn envelopes in polynomial time is as hard as learning CNFs in polynomial time. To showcase the applicability of the approach, we perform experiments on BERT based language models and extract Horn envelopes that expose occupation-based gender biases.

Bidragsytere

Sophie Martina Blum

Bidragsyterens navn vises på dette resultatet som Sophie Blum
  • Tilknyttet:
    Forfatter
    ved Institutt for informatikk ved Universitetet i Bergen

Raoul Koudijs

  • Tilknyttet:
    Forfatter
    ved Institutt for informatikk ved Universitetet i Bergen
Aktiv cristin-person

Ana Helena Ozaki Rivera Castillo

Bidragsyterens navn vises på dette resultatet som Ana Ozaki
  • Tilknyttet:
    Forfatter
    ved Institutt for informatikk ved Universitetet i Bergen
  • Tilknyttet:
    Forfatter
    ved PROG Programmering ved Universitetet i Oslo

Samia Touileb

  • Tilknyttet:
    Forfatter
    ved Institutt for informasjons- og medievitenskap ved Universitetet i Bergen
1 - 4 av 4