deepseek-ai · yunkchen · Jan 22, 2026 · dino65-dev · Jan 23, 2026 · dino65-dev
diff --git a/engram_demo_v1.py b/engram_demo_v1.py
@@ -302,6 +302,43 @@ def hash(self, input_ids):
             hash_ids_for_all_layers[layer_id] = self._get_ngram_hashes(input_ids, layer_id=layer_id)
         return hash_ids_for_all_layers
 
+_HASH_MAPPING_CACHE = {}
+# Ensures that an NgramHashMapping with identical configuration is created only once.
+def get_or_create_hash_mapping(
+    engram_vocab_size,
+    max_ngram_size,
+    n_embed_per_ngram,
+    n_head_per_ngram,
+    layer_ids,
+    tokenizer_name_or_path,
+    pad_id,
+    seed,
+):
+    cache_key = (
+        tuple(engram_vocab_size),
+        max_ngram_size,
+        n_embed_per_ngram,
+        n_head_per_ngram,
+        tuple(layer_ids),
+        tokenizer_name_or_path,
+        pad_id,
+        seed,
+    )
+
+    if cache_key not in _HASH_MAPPING_CACHE:
+        _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
+            engram_vocab_size=engram_vocab_size,
+            max_ngram_size=max_ngram_size,
+            n_embed_per_ngram=n_embed_per_ngram,
+            n_head_per_ngram=n_head_per_ngram,
+            layer_ids=layer_ids,
+            tokenizer_name_or_path=tokenizer_name_or_path,
+            pad_id=pad_id,
+            seed=seed,
+        )
-    cache_key = (
-        tuple(engram_vocab_size),
-        max_ngram_size,
-        n_embed_per_ngram,
-        n_head_per_ngram,
-        tuple(layer_ids),
-        tokenizer_name_or_path,
-        pad_id,
-        seed,
-    )
-    
-    if cache_key not in _HASH_MAPPING_CACHE:
-        _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
-            engram_vocab_size=engram_vocab_size,
-            max_ngram_size=max_ngram_size,
-            n_embed_per_ngram=n_embed_per_ngram,
-            n_head_per_ngram=n_head_per_ngram,
-            layer_ids=layer_ids,
-            tokenizer_name_or_path=tokenizer_name_or_path,
-            pad_id=pad_id,
-            seed=seed,
-        )
+_HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
+    engram_vocab_size=engram_vocab_size,
+    max_ngram_size=max_ngram_size,
+    n_embed_per_ngram=n_embed_per_ngram,
+    n_head_per_ngram=n_head_per_ngram,
+    layer_ids=tuple(layer_ids),  # <- immutable copy
+    tokenizer_name_or_path=tokenizer_name_or_path,
+    pad_id=pad_id,
+    seed=seed,
+)
-    cache_key = (
-        tuple(engram_vocab_size),
-        max_ngram_size,
-        n_embed_per_ngram,
-        n_head_per_ngram,
-        tuple(layer_ids),
-        tokenizer_name_or_path,
-        pad_id,
-        seed,
-    )
-    
-    if cache_key not in _HASH_MAPPING_CACHE:
-        _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
-            engram_vocab_size=engram_vocab_size,
-            max_ngram_size=max_ngram_size,
-            n_embed_per_ngram=n_embed_per_ngram,
-            n_head_per_ngram=n_head_per_ngram,
-            layer_ids=layer_ids,
-            tokenizer_name_or_path=tokenizer_name_or_path,
-            pad_id=pad_id,
-            seed=seed,
-        )
+_HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
+    engram_vocab_size=engram_vocab_size,
+    max_ngram_size=max_ngram_size,
+    n_embed_per_ngram=n_embed_per_ngram,
+    n_head_per_ngram=n_head_per_ngram,
+    layer_ids=tuple(layer_ids),  # <- immutable copy
+    tokenizer_name_or_path=tokenizer_name_or_path,
+    pad_id=pad_id,
+    seed=seed,
+)
+
-    if cache_key not in _HASH_MAPPING_CACHE:
-        _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
-            engram_vocab_size=engram_vocab_size,
-            max_ngram_size=max_ngram_size,
-            n_embed_per_ngram=n_embed_per_ngram,
-            n_head_per_ngram=n_head_per_ngram,
-            layer_ids=layer_ids,
-            tokenizer_name_or_path=tokenizer_name_or_path,
-            pad_id=pad_id,
-            seed=seed,
-        )
-    
+import threading
+_HASH_MAPPING_CACHE = {}
+_HASH_MAPPING_LOCK = threading.Lock()
+def get_or_create_hash_mapping(...):
+    cache_key = (...)
+    
+    with _HASH_MAPPING_LOCK:
+        if cache_key not in _HASH_MAPPING_CACHE:
+            _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(...)
+        return _HASH_MAPPING_CACHE[cache_key]
-    if cache_key not in _HASH_MAPPING_CACHE:
-        _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
-            engram_vocab_size=engram_vocab_size,
-            max_ngram_size=max_ngram_size,
-            n_embed_per_ngram=n_embed_per_ngram,
-            n_head_per_ngram=n_head_per_ngram,
-            layer_ids=layer_ids,
-            tokenizer_name_or_path=tokenizer_name_or_path,
-            pad_id=pad_id,
-            seed=seed,
-        )
-    
+import threading
+_HASH_MAPPING_CACHE = {}
+_HASH_MAPPING_LOCK = threading.Lock()
+def get_or_create_hash_mapping(...):
+    cache_key = (...)
+    
+    with _HASH_MAPPING_LOCK:
+        if cache_key not in _HASH_MAPPING_CACHE:
+            _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(...)
+        return _HASH_MAPPING_CACHE[cache_key]
+    return _HASH_MAPPING_CACHE[cache_key]
-_HASH_MAPPING_CACHE = {}
-# Ensures that an NgramHashMapping with identical configuration is created only once.
-def get_or_create_hash_mapping(
-    engram_vocab_size,
-    max_ngram_size,
-    n_embed_per_ngram,
-    n_head_per_ngram,
-    layer_ids,
-    tokenizer_name_or_path,
-    pad_id,
-    seed,
-):
-    cache_key = (
-        tuple(engram_vocab_size),
-        max_ngram_size,
-        n_embed_per_ngram,
-        n_head_per_ngram,
-        tuple(layer_ids),
-        tokenizer_name_or_path,
-        pad_id,
-        seed,
-    )
-    
-    if cache_key not in _HASH_MAPPING_CACHE:
-        _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
-            engram_vocab_size=engram_vocab_size,
-            max_ngram_size=max_ngram_size,
-            n_embed_per_ngram=n_embed_per_ngram,
-            n_head_per_ngram=n_head_per_ngram,
-            layer_ids=layer_ids,
-            tokenizer_name_or_path=tokenizer_name_or_path,
-            pad_id=pad_id,
-            seed=seed,
-        )
-    
-    return _HASH_MAPPING_CACHE[cache_key]
+from functools import lru_cache
+@lru_cache(maxsize=8)
+def get_or_create_hash_mapping(
+    engram_vocab_size,  # must be tuple, not list
+    max_ngram_size,
+    n_embed_per_ngram,
+    n_head_per_ngram,
+    layer_ids,          # must be tuple, not list
+    tokenizer_name_or_path,
+    pad_id,
+    seed,
+):
+    return NgramHashMapping(
+        engram_vocab_size=engram_vocab_size,
+        max_ngram_size=max_ngram_size,
+        n_embed_per_ngram=n_embed_per_ngram,
+        n_head_per_ngram=n_head_per_ngram,
+        layer_ids=layer_ids,
+        tokenizer_name_or_path=tokenizer_name_or_path,
+        pad_id=pad_id,
+        seed=seed,
+    )
-_HASH_MAPPING_CACHE = {}
-# Ensures that an NgramHashMapping with identical configuration is created only once.
-def get_or_create_hash_mapping(
-    engram_vocab_size,
-    max_ngram_size,
-    n_embed_per_ngram,
-    n_head_per_ngram,
-    layer_ids,
-    tokenizer_name_or_path,
-    pad_id,
-    seed,
-):
-    cache_key = (
-        tuple(engram_vocab_size),
-        max_ngram_size,
-        n_embed_per_ngram,
-        n_head_per_ngram,
-        tuple(layer_ids),
-        tokenizer_name_or_path,
-        pad_id,
-        seed,
-    )
-    
-    if cache_key not in _HASH_MAPPING_CACHE:
-        _HASH_MAPPING_CACHE[cache_key] = NgramHashMapping(
-            engram_vocab_size=engram_vocab_size,
-            max_ngram_size=max_ngram_size,
-            n_embed_per_ngram=n_embed_per_ngram,
-            n_head_per_ngram=n_head_per_ngram,
-            layer_ids=layer_ids,
-            tokenizer_name_or_path=tokenizer_name_or_path,
-            pad_id=pad_id,
-            seed=seed,
-        )
-    
-    return _HASH_MAPPING_CACHE[cache_key]
+from functools import lru_cache
+@lru_cache(maxsize=8)
+def get_or_create_hash_mapping(
+    engram_vocab_size,  # must be tuple, not list
+    max_ngram_size,
+    n_embed_per_ngram,
+    n_head_per_ngram,
+    layer_ids,          # must be tuple, not list
+    tokenizer_name_or_path,
+    pad_id,
+    seed,
+):
+    return NgramHashMapping(
+        engram_vocab_size=engram_vocab_size,
+        max_ngram_size=max_ngram_size,
+        n_embed_per_ngram=n_embed_per_ngram,
+        n_head_per_ngram=n_head_per_ngram,
+        layer_ids=layer_ids,
+        tokenizer_name_or_path=tokenizer_name_or_path,
+        pad_id=pad_id,
+        seed=seed,
+    )
+
 class MultiHeadEmbedding(nn.Module):
     def __init__(self, list_of_N: List[int], D: int):
         super().__init__()
@@ -327,7 +364,7 @@ class Engram(nn.Module):
     def __init__(self, layer_id):
         super().__init__()
         self.layer_id = layer_id
-        self.hash_mapping = NgramHashMapping(
+        self.hash_mapping = get_or_create_hash_mapping(
             engram_vocab_size=engram_cfg.engram_vocab_size,
             max_ngram_size = engram_cfg.max_ngram_size,
             n_embed_per_ngram = engram_cfg.n_embed_per_ngram,
@@ -420,4 +457,4 @@ def forward(self,input_ids,hidden_states):
 
     print("✅ Forward Complete!")
     print(f"{input_ids.shape=}\n{output.shape=}")
-
+