Post-hoc Interpretability for Generative Language Models: Explaining Context Usage in Transformers

Name: Post-hoc Interpretability for Generative Language Models: Explaining Context Usage in Transformers
Start: 2024-03-01T17:00:00+01:00
Location: Online