Engram: Conditional Memory via Scalable Lookup

A new axis of sparsity for large language models. Builds upon finding from Geva et al "Transformer Feed-Forward Layers Are Key-Value Memories" (2021).

Paper (arXiv)Video from Prompt Engineering

Paper

arXiv HTML

architecturesparsityresearch