From 4cf94f809262d160130d5bbeb9691f850e051863 Mon Sep 17 00:00:00 2001
From: cr-marcstevens <github@marc-stevens.nl>
Date: Tue, 12 Nov 2019 11:46:47 +0100
Subject: [PATCH 1/2] strategize: allow walltime as metric, allow setting #
 enum threads

---
 set_mdc.py             |  16 +-
 setup.sh               |   6 +-
 strategize_walltime.py | 343 +++++++++++++++++++++++++++++++++++++++++
 3 files changed, 361 insertions(+), 4 deletions(-)
 create mode 100644 strategize_walltime.py

diff --git a/set_mdc.py b/set_mdc.py
index ce41b23..baf0e74 100644
--- a/set_mdc.py
+++ b/set_mdc.py
@@ -6,12 +6,24 @@
 """
 
 import pickle
+import argparse
+from fpylll import FPLLL
 from fpylll.tools.benchmark import bench_enumeration
 from strategizer.config import logging
 logger = logging.getLogger(__name__)
 
-nodes, time = bench_enumeration(44)
-logger.info("  fplll :: nodes: %12.1f, time: %6.4fs, nodes/s: %12.1f"%(nodes, time, nodes/time))
+parser = argparse.ArgumentParser(description='options')
+parser.add_argument('-e', '--enumthreads', help='number of fplll threads to use', type=int, default=-1)
+args = parser.parse_args()
+
+FPLLL.set_threads(args.enumthreads)
+
+time = 0
+dim = 40
+while time < 10:
+    dim += 2
+    nodes, time = bench_enumeration(dim)
+    logger.info("  fplll :: dim: %i, nodes: %12.1f, time: %6.4fs, nodes/s: %12.1f"%(dim, nodes, time, nodes/time))
 
 f = open("mdc.data", "wb")
 pickle.dump(nodes/time, f)
diff --git a/setup.sh b/setup.sh
index 6a8c64d..43ec015 100755
--- a/setup.sh
+++ b/setup.sh
@@ -9,8 +9,9 @@ fi
    
 cd fplll
 ./autogen.sh
-./configure --prefix="$VIRTUAL_ENV"
-make
+./configure --prefix="$VIRTUAL_ENV" --with-max-parallel-enum-dim=120
+make clean
+make -j4
 make install
 cd ..
 
@@ -20,6 +21,7 @@ pip install Cython
 pip install -r requirements.txt
 pip install -r suggestions.txt
 export PKG_CONFIG_PATH="$VIRTUAL_ENV/lib/pkgconfig:$PKG_CONFIG_PATH"
+python setup.py clean
 python setup.py build_ext
 python setup.py install
 cd ..
diff --git a/strategize_walltime.py b/strategize_walltime.py
new file mode 100644
index 0000000..6117df9
--- /dev/null
+++ b/strategize_walltime.py
@@ -0,0 +1,343 @@
+# -*- coding: utf-8 -*-
+u"""
+Find BKZ reduction strategies using timing experiments.
+
+.. moduleauthor:: Martin R.  Albrecht <fplll-devel@googlegroups.com>
+.. moduleauthor:: Léo Ducas  <fplll-devel@googlegroups.com>
+.. moduleauthor:: Marc Stevens  <fplll-devel@googlegroups.com>
+
+"""
+
+# We use multiprocessing to parallelize
+
+
+from __future__ import absolute_import
+from multiprocessing import Queue, Pipe, Process, active_children
+import sys
+import time
+
+from fpylll import IntegerMatrix, GSO, FPLLL, BKZ
+from fpylll.tools.bkz_stats import BKZTreeTracer
+from fpylll.fplll.bkz_param import Strategy, dump_strategies_json
+
+from strategizer.bkz import CallbackBKZ
+from strategizer.bkz import CallbackBKZParam as Param
+from strategizer.config import logging, git_revision
+from strategizer.util import chunk_iterator
+from strategizer.strategizers import PruningStrategizer,\
+    OneTourPreprocStrategizerFactory, \
+    TwoTourPreprocStrategizerFactory, \
+    FourTourPreprocStrategizerFactory, \
+    ProgressivePreprocStrategizerFactory
+logger = logging.getLogger(__name__)
+
+
+def find_best(state, fudge=1.05):
+    """
+    Given an ordered tuple of tuples, return the minimal one, where
+    minimal is determined by first entry.
+
+    :param state:
+    :param fudge:
+
+
+    .. note :: The fudge factor means that we have a bias towards later entries.
+    """
+    bestbest = state[0]
+    for s in state:
+        if bestbest[0] > s[0]:
+            bestbest = s
+    best = bestbest
+    for s in state:
+        if bestbest[0]*fudge > s[0]:
+            best = s
+    return best
+
+
+def worker_process(seed, params, queue=None, enumthreads=-1):
+    """
+    This function is called to collect statistics.
+
+    :param A: basis
+    :param params: BKZ parameters
+    :param queue: queue used for communication
+
+    """
+    FPLLL.set_random_seed(seed)
+    FPLLL.set_threads(enumthreads)
+
+    A = IntegerMatrix.random(params.block_size, "qary", bits=30, k=params.block_size//2, int_type="long")
+
+    M = GSO.Mat(A)
+    bkz = CallbackBKZ(M)  # suppresses initial LLL call
+    tracer = BKZTreeTracer(bkz, start_clocks=True)
+
+    with tracer.context(("tour", 0)):
+        bkz.svp_reduction(0, params.block_size, params, tracer)
+        M.update_gso()
+
+    tracer.exit()
+    try:
+        # close connection
+        params.strategies[params.block_size].connection.send(None)
+    except AttributeError:
+        pass
+    if queue:
+        queue.put(tracer.trace)
+    else:
+        return tracer.trace
+
+
+def callback_roundtrip(alive, k, connections, data):
+    """
+    Send ``data`` on ``connections`` for processes ids in ``alive``, ``k`` at a time.
+
+    :param alive:
+    :param k:
+    :param connections:
+    :param data:
+    """
+    callback = [None]*len(connections)
+
+    for chunk in chunk_iterator(alive, k):
+        for i in chunk:
+            connections[i].send(data)
+
+        for i in chunk:
+            try:
+                callback[i] = connections[i].recv()
+            except EOFError:
+                callback[i] = None
+                connections[i].close()
+
+    return callback
+
+
+def discover_strategy(block_size, Strategizer, strategies,
+                      nthreads=1, nsamples=50, enumthreads=-1):
+    """Discover a strategy using ``Strategizer``
+
+    :param block_size: block size to try
+    :param Strategizer: strategizer to use
+    :param strategies: strategies for smaller block sizes
+    :param nthreads: number of threads to run
+    :param nsamples: number of lattice bases to consider
+    :param subprocess:
+
+    """
+    connections = []
+    processes = []
+    k = nthreads
+    m = nsamples
+
+    strategizer = Strategizer(block_size)
+
+    # everybody is alive in the beginning
+    alive = range(m)
+
+    return_queue = Queue()
+
+    for i in range(m):
+        manager, worker = Pipe()
+        connections.append((manager, worker))
+        strategies_ = list(strategies)
+        strategies_.append(Strategizer.Strategy(block_size, worker))
+
+        # note: success probability, rerandomisation density etc. can be adapted here
+        param = Param(block_size=block_size, strategies=strategies_, flags=BKZ.GH_BND)
+        process = Process(target=worker_process, args=(2**16 * block_size + i, param, return_queue, enumthreads))
+        processes.append(process)
+
+    callback = [None]*m
+    for chunk in chunk_iterator(alive, k):
+        for i in chunk:
+            process = processes[i]
+            process.start()
+            manager, worker = connections[i]
+            worker.close()
+            connections[i] = manager
+
+        # wait for `k` responses
+        for i in chunk:
+            callback[i] = connections[i].recv()
+
+    assert all(callback)  # everybody wants preprocessing parameters
+
+    preproc_params = strategizer(callback)
+
+    callback = callback_roundtrip(alive, k, connections, preproc_params)
+    assert all(callback)  # everybody wants pruning parameters
+
+    pruning_params = strategizer(callback)
+
+    callback = callback_roundtrip(alive, k, connections, pruning_params)
+    assert not any(callback)  # no more questions
+
+    strategy = Strategy(block_size=block_size,
+                        preprocessing_block_sizes=preproc_params,
+                        pruning_parameters=pruning_params)
+
+    active_children()
+
+    stats = []
+    for i in range(m):
+        stats.append(return_queue.get())
+
+    return strategy, tuple(stats), tuple(strategizer.queries)
+
+
+def strategize(max_block_size,
+               existing_strategies=None,
+               min_block_size=3,
+               nthreads=1, nsamples=50,
+               pruner_method="hybrid",
+               StrategizerFactory=ProgressivePreprocStrategizerFactory,
+               dump_filename=None,
+               enumthreads=-1,
+               usewalltime=False):
+    """
+    *one* preprocessing block size + pruning.
+
+    :param max_block_size: maximum block size to consider
+    :param strategizers: strategizers to use
+    :param existing_strategies: extend these previously computed strategies
+    :param min_block_size: start at this block size
+    :param nthreads: use this many threads
+    :param nsamples: start using this many samples
+    :param dump_filename: write strategies to this filename
+
+    """
+    if dump_filename is None:
+        dump_filename = "default-strategies-%s.json"%git_revision
+
+    if existing_strategies is not None:
+        strategies = existing_strategies
+        times = [None]*len(strategies)
+    else:
+        strategies = []
+        times = []
+
+    for i in range(len(strategies), min_block_size):
+        strategies.append(Strategy(i, [], []))
+        times.append(None)
+
+    strategizer = PruningStrategizer
+
+    for block_size in range(min_block_size, max_block_size+1):
+        logger.info("= block size: %3d, samples: %3d =", block_size, nsamples)
+
+        state = []
+
+        try:
+            p = max(strategies[-1].preprocessing_block_sizes[-1] - 4, 2)
+        except (IndexError,):
+            p = 2
+
+        prev_best_time = None
+        while p < block_size:
+            if p >= 4:
+                strategizer_p = type("PreprocStrategizer-%d"%p,
+                                     (strategizer, StrategizerFactory(p)), {})
+            else:
+                strategizer_p = strategizer
+
+            strategy, stats, queries = discover_strategy(block_size,
+                                                         strategizer_p,
+                                                         strategies,
+                                                         nthreads=nthreads,
+                                                         nsamples=nsamples,
+                                                         enumthreads=enumthreads
+                                                         )
+
+            stats = [stat for stat in stats if stat is not None]
+
+            wall_time = [float(stat.data["walltime"]) for stat in stats]
+            cpu_time = [float(stat.data["cputime"]) for stat in stats]
+            svp_time = [float(stat.find("enumeration").data["cputime"]) for stat in stats]
+            preproc_time = [float(stat.find("preprocessing").data["cputime"]) for stat in stats]
+
+            wall_time = sum(wall_time)/len(wall_time)
+            cpu_time = sum(cpu_time)/len(cpu_time)
+            svp_time = sum(svp_time)/len(svp_time)
+            preproc_time = sum(preproc_time)/len(preproc_time)
+            if usewalltime:
+                metric_time=wall_time
+            else:
+                metric_time=cpu_time
+
+            state.append((metric_time, wall_time, cpu_time, strategy, stats, strategizer, queries))
+            logger.info("W%10.6fs, C%10.6fs, P%10.6fs, E%10.6fs, %s", wall_time, cpu_time, preproc_time, svp_time, strategy)
+
+            if prev_best_time and 2.0*prev_best_time < metric_time:
+                break
+            p += 2
+            if not prev_best_time or prev_best_time > metric_time:
+                prev_best_time = metric_time
+
+        best = find_best(state)
+        metric_time, wall_time, total_time, strategy, stats, strategizer, queries = best
+
+        strategies.append(strategy)
+        dump_strategies_json(dump_filename, strategies)
+        times.append((total_time, stats, queries))
+
+        logger.info("")
+        logger.info("block size: %3d, time: %10.6fs, strategy: %s", block_size, metric_time, strategy)
+        logger.info("")
+
+        if total_time > 1 and nsamples > max(2*nthreads, 64):
+            nsamples //= 2
+
+    return strategies, times
+
+
+StrategizerFactoryDictionnary = {
+    "ProgressivePreproc": ProgressivePreprocStrategizerFactory,
+    "OneTourPreproc": OneTourPreprocStrategizerFactory,
+    "TwoTourPreproc": TwoTourPreprocStrategizerFactory,
+    "FourTourPreproc": FourTourPreprocStrategizerFactory}
+
+if __name__ == '__main__':
+    import argparse
+    import logging
+    import os
+
+    FPLLL.set_threads(1)
+
+    parser = argparse.ArgumentParser(description='Preprocessing Search')
+    parser.add_argument('-t', '--threads', help='number of strategizer threads to use', type=int, default=1)
+    parser.add_argument('-e', '--enumthreads', help='number of fplll threads to use', type=int, default=-1)
+    parser.add_argument('-s', '--samples', help='number of samples to try', type=int, default=16)
+    parser.add_argument('-l', '--min-block-size', help='minimal block size to consider', type=int, default=3)
+    parser.add_argument('-u', '--max-block-size', help='minimal block size to consider', type=int, default=50)
+    parser.add_argument('-f', '--filename', help='json file to store strategies to', type=str, default=None)
+    parser.add_argument('-m', '--method', help='descent method for the pruner {gradient,nm,hybrid}',
+                        type=str, default="hybrid")
+    parser.add_argument('-S', '--strategizer',
+                        help='Strategizer : {ProgressivePreproc,OneTourPreproc,TwoTourPreproc,FourTourPreproc}',
+                        type=str, default="OneTourPreproc")
+    parser.add_argument('-W', '--walltime', help='optimize on walltime instead of cputime', dest='usewalltime', action='store_true')
+    parser.set_defaults(usewalltime=False)
+
+    args = parser.parse_args()
+
+    log_name = os.path.join("default-strategies-%s.log"%(git_revision))
+
+    if args.filename:
+        if not args.filename.endswith(".json"):
+            raise ValueError("filename should be a json file")
+        log_name = args.filename.replace(".json", ".log")
+
+    extra = logging.FileHandler(log_name)
+    extra.setLevel(logging.DEBUG)
+    formatter = logging.Formatter('%(name)s: %(message)s',)
+    extra.setFormatter(formatter)
+    logging.getLogger('').addHandler(extra)
+
+    strategize(nthreads=args.threads, nsamples=args.samples,
+               min_block_size=args.min_block_size,
+               max_block_size=args.max_block_size,
+               StrategizerFactory=StrategizerFactoryDictionnary[args.strategizer],
+               dump_filename=args.filename,
+               enumthreads=args.enumthreads,
+               usewalltime=args.usewalltime)

From 7f8654116e0bfd71aef635f9cede2d70364c5a2c Mon Sep 17 00:00:00 2001
From: cr-marcstevens <github@marc-stevens.nl>
Date: Tue, 12 Nov 2019 11:56:15 +0100
Subject: [PATCH 2/2] use specific fplll & fpylll commits

---
 fplll  | 2 +-
 fpylll | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/fplll b/fplll
index b53c0b9..8cbf5a6 160000
--- a/fplll
+++ b/fplll
@@ -1 +1 @@
-Subproject commit b53c0b9c37060bbcd7bb875109c79edd5c8b934a
+Subproject commit 8cbf5a6a2ec86a12ba150b89c0e84c4274452e93
diff --git a/fpylll b/fpylll
index 6efa0a7..f723af4 160000
--- a/fpylll
+++ b/fpylll
@@ -1 +1 @@
-Subproject commit 6efa0a73a10a2dd41f5bcbe278872a7e4c09ffa5
+Subproject commit f723af4bbb05f0ca9a1ca52b643fe53218a92828