From db43ed22142410efe28ed772005022c9d2ae7b47 Mon Sep 17 00:00:00 2001
From: konard <drakonard@gmail.com>
Date: Tue, 27 Jan 2026 21:23:07 +0100
Subject: [PATCH 1/4] Initial commit with task details

Adding CLAUDE.md with task information for AI processing.
This file will be removed when the task is complete.

Issue: https://github.com/netkeep80/NNets/issues/21
---
 CLAUDE.md | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/CLAUDE.md b/CLAUDE.md
index 043e473..aa17835 100644
--- a/CLAUDE.md
+++ b/CLAUDE.md
@@ -5,3 +5,16 @@ Your forked repository: konard/netkeep80-NNets
 Original repository (upstream): netkeep80/NNets
 
 Proceed.
+
+---
+
+Issue to solve: https://github.com/netkeep80/NNets/issues/21
+Your prepared branch: issue-21-538542164f70
+Your prepared working directory: /tmp/gh-issue-solver-1769545380723
+Your forked repository: konard/netkeep80-NNets
+Original repository (upstream): netkeep80/NNets
+
+Proceed.
+
+
+Run timestamp: 2026-01-27T20:23:07.478Z
\ No newline at end of file

From 6feea07c896fcb59ab9a2554537e43395c7453e8 Mon Sep 17 00:00:00 2001
From: konard <drakonard@gmail.com>
Date: Tue, 27 Jan 2026 21:34:59 +0100
Subject: [PATCH 2/4] =?UTF-8?q?=D0=98=D1=81=D0=BF=D1=80=D0=B0=D0=B2=D0=B8?=
 =?UTF-8?q?=D1=82=D1=8C=20=D0=BE=D1=88=D0=B8=D0=B1=D0=BA=D1=83=20=D0=BC?=
 =?UTF-8?q?=D0=BD=D0=BE=D0=B3=D0=BE=D0=BF=D0=BE=D1=82=D0=BE=D1=87=D0=BD?=
 =?UTF-8?q?=D1=8B=D1=85=20=D0=B2=D1=8B=D1=87=D0=B8=D1=81=D0=BB=D0=B5=D0=BD?=
 =?UTF-8?q?=D0=B8=D0=B9?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Проблема: многопоточный режим (-j N) не давал ускорения из-за
слишком высокого порога переключения на параллельный поиск (500000).
При типичных значениях (Neirons=2130, Receptors=20) count_max=170400,
что ниже порога, и всегда использовался однопоточный режим.

Решение:
1. Снижен порог для включения параллельного режима:
   - Было: count_max < 500000 (эффективно отключало параллелизм)
   - Стало: count_max < MIN_ITERATIONS_PER_THREAD * NumThreads
   - MIN_ITERATIONS_PER_THREAD = 100 обеспечивает качественный поиск

2. Каждый поток теперь выполняет полное количество итераций (count_max):
   - Общее количество исследованных комбинаций увеличивается в NumThreads раз
   - Это обеспечивает лучшее качество поиска при параллельном выполнении
   - Все ядра CPU загружаются полностью

Результаты тестирования:
- configs/benchmark.json: speedup 2.26x-2.69x (2-6 потоков)
- configs/default.json: speedup 1.16x-1.50x (2-6 потоков)
- Все 8 тестов проходят успешно

Добавлен эксперимент experiments/test_multithreading_speedup.sh
для измерения ускорения при разном количестве потоков.

Fixes netkeep80/NNets#21

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
---
 experiments/test_multithreading_speedup.sh | 76 ++++++++++++++++++++++
 include/neuron_generation.h                | 48 +++++++-------
 2 files changed, 100 insertions(+), 24 deletions(-)
 create mode 100755 experiments/test_multithreading_speedup.sh

diff --git a/experiments/test_multithreading_speedup.sh b/experiments/test_multithreading_speedup.sh
new file mode 100755
index 0000000..3521fac
--- /dev/null
+++ b/experiments/test_multithreading_speedup.sh
@@ -0,0 +1,76 @@
+#!/bin/bash
+#
+# test_multithreading_speedup.sh
+#
+# Experiment script to verify that multithreading actually utilizes multiple CPU cores
+# and provides performance benefits.
+#
+# Usage: ./test_multithreading_speedup.sh [build_dir] [config_file]
+#
+# This script:
+# 1. Runs the benchmark in single-threaded mode
+# 2. Runs the benchmark in multi-threaded mode with different thread counts
+# 3. Compares the results and calculates speedup
+#
+
+set -e
+
+# Default paths
+BUILD_DIR="${1:-../build}"
+CONFIG_FILE="${2:-../configs/default.json}"
+EXECUTABLE="${BUILD_DIR}/NNets"
+
+if [ ! -f "$EXECUTABLE" ]; then
+    echo "Error: Executable not found at $EXECUTABLE"
+    echo "Please build the project first: cd build && cmake .. && make"
+    exit 1
+fi
+
+if [ ! -f "$CONFIG_FILE" ]; then
+    echo "Error: Config file not found at $CONFIG_FILE"
+    exit 1
+fi
+
+echo "=============================================="
+echo "Multithreading Speedup Experiment"
+echo "=============================================="
+echo "Executable: $EXECUTABLE"
+echo "Config: $CONFIG_FILE"
+echo "Available CPU cores: $(nproc)"
+echo ""
+
+# Function to extract training time from benchmark output
+extract_training_time() {
+    grep "Training time:" | sed 's/.*Training time: \([0-9]*\) ms/\1/'
+}
+
+# Function to extract thread count from benchmark output
+extract_thread_count() {
+    grep "Threads:" | sed 's/.*Threads: \([0-9]*\).*/\1/'
+}
+
+echo "Running single-threaded benchmark..."
+SINGLE_OUTPUT=$("$EXECUTABLE" -c "$CONFIG_FILE" -b --single-thread 2>&1)
+SINGLE_TIME=$(echo "$SINGLE_OUTPUT" | extract_training_time)
+echo "  Single-threaded training time: ${SINGLE_TIME} ms"
+echo ""
+
+echo "Running multi-threaded benchmarks..."
+
+for THREADS in 2 4 $(nproc); do
+    MULTI_OUTPUT=$("$EXECUTABLE" -c "$CONFIG_FILE" -b -j "$THREADS" 2>&1)
+    MULTI_TIME=$(echo "$MULTI_OUTPUT" | extract_training_time)
+    ACTUAL_THREADS=$(echo "$MULTI_OUTPUT" | extract_thread_count)
+
+    if [ -n "$MULTI_TIME" ] && [ "$MULTI_TIME" -gt 0 ]; then
+        SPEEDUP=$(echo "scale=2; $SINGLE_TIME / $MULTI_TIME" | bc)
+        echo "  ${ACTUAL_THREADS} threads: ${MULTI_TIME} ms (speedup: ${SPEEDUP}x)"
+    else
+        echo "  ${THREADS} threads: Failed to get timing"
+    fi
+done
+
+echo ""
+echo "=============================================="
+echo "Experiment completed"
+echo "=============================================="
diff --git a/include/neuron_generation.h b/include/neuron_generation.h
index 64a4625..d9cddac 100644
--- a/include/neuron_generation.h
+++ b/include/neuron_generation.h
@@ -696,9 +696,10 @@ void SearchThreadFunc(
  * между несколькими потоками. Каждый поток исследует
  * случайные комбинации параметров нейронов независимо.
  *
- * Ключевая идея: общее количество итераций увеличивается
- * пропорционально количеству потоков, что обеспечивает
- * эквивалентное качество поиска при большей скорости.
+ * Ключевая идея: каждый поток выполняет ПОЛНОЕ количество
+ * итераций (count_max), что увеличивает общее количество
+ * исследованных комбинаций пропорционально числу потоков.
+ * Это обеспечивает лучшее качество поиска при большей скорости.
  *
  * @return минимальная достигнутая ошибка, или big если не найдено
  */
@@ -708,32 +709,31 @@ float rndrod4_parallel() {
         return rndrod4();
     }
 
-    // Общее количество итераций для параллельного поиска
-    // Каждый поток получает count_max / NumThreads итераций
-    // Но общее количество итераций (сумма по всем потокам) равно count_max
+    // Общее количество итераций для однопоточного поиска
     int count_max = Neirons * Receptors * 4;
 
-    // Для задач с малым и средним количеством нейронов параллелизация
-    // может привести к нестабильному качеству поиска из-за:
-    // 1. Независимости траекторий поиска между потоками
-    // 2. Меньшего количества итераций на поток при делении workload
-    // 3. Разных точек сходимости случайного поиска
-    //
-    // Используем однопоточную версию для обеспечения стабильного качества
-    // обучения на небольших и средних задачах (< 500 нейронов).
-    // Параллельный режим применяется только для крупных сетей, где
-    // объём вычислений достаточен для надёжного параллельного поиска.
-    //
-    // Порог: count_max = Neirons * Receptors * 4
-    // При Neirons = 500, Receptors = 20: count_max = 40000
-    // Используем порог 500000 чтобы гарантировать Neirons >= 6250 при Receptors=20
-    if (count_max < 500000) {
+    // Минимальное количество итераций на поток для качественного поиска.
+    // При слишком малом количестве итераций случайный поиск может
+    // не найти хорошее решение из-за недостаточного исследования
+    // пространства параметров.
+    const int MIN_ITERATIONS_PER_THREAD = 100;
+
+    // Используем однопоточную версию если общее количество итераций
+    // слишком мало для эффективного распределения между потоками.
+    // Порог = MIN_ITERATIONS_PER_THREAD * NumThreads
+    // Это гарантирует, что каждый поток получит минимум MIN_ITERATIONS_PER_THREAD итераций.
+    int min_total_iterations = MIN_ITERATIONS_PER_THREAD * NumThreads;
+    if (count_max < min_total_iterations) {
         return rndrod4();
     }
 
-    // Каждый поток выполняет часть итераций
-    // Для крупных сетей это обеспечивает значительное ускорение
-    int iterations_per_thread = (count_max + NumThreads - 1) / NumThreads;
+    // Каждый поток выполняет ПОЛНОЕ количество итераций (count_max),
+    // что увеличивает общее количество исследованных комбинаций
+    // в NumThreads раз. Это обеспечивает:
+    // 1. Лучшее качество поиска (больше комбинаций исследовано)
+    // 2. Эффективное использование всех доступных ядер
+    // 3. Масштабируемость: больше потоков = больше исследованных комбинаций
+    int iterations_per_thread = count_max;
 
     // Создаём результаты для каждого потока
     vector<ThreadSearchResult> results(NumThreads);

From 7ca28d1608727e2a0db824d3cf4f66db7c0eede0 Mon Sep 17 00:00:00 2001
From: konard <drakonard@gmail.com>
Date: Tue, 27 Jan 2026 21:45:02 +0100
Subject: [PATCH 3/4] =?UTF-8?q?=D0=A3=D0=BB=D1=83=D1=87=D1=88=D0=B8=D1=82?=
 =?UTF-8?q?=D1=8C=20=D1=81=D1=82=D0=B0=D0=B1=D0=B8=D0=BB=D1=8C=D0=BD=D0=BE?=
 =?UTF-8?q?=D1=81=D1=82=D1=8C=20=D0=BF=D0=B0=D1=80=D0=B0=D0=BB=D0=BB=D0=B5?=
 =?UTF-8?q?=D0=BB=D1=8C=D0=BD=D0=BE=D0=B3=D0=BE=20=D0=BF=D0=BE=D0=B8=D1=81?=
 =?UTF-8?q?=D0=BA=D0=B0?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

1. Увеличено минимальное количество итераций на поток с 100 до 1000
   для обеспечения достаточного покрытия пространства поиска

2. Изменена стратегия распределения работы:
   - Общее количество итераций делится между потоками
   - Каждый поток получает минимум MIN_ITERATIONS_PER_THREAD итераций
   - Это обеспечивает баланс между скоростью и качеством поиска

3. Установлен минимальный порог count_max < 2000 для использования
   однопоточной версии, чтобы накладные расходы на потоки
   не превышали выгоду от параллелизации

Результаты тестирования:
- configs/benchmark.json: speedup 2.69x-7.56x
- configs/default.json: speedup 1.52x-3.28x
- Все 8 тестов проходят стабильно (проверено 5 запусков)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
---
 include/neuron_generation.h | 41 ++++++++++++++++++-------------------
 1 file changed, 20 insertions(+), 21 deletions(-)

diff --git a/include/neuron_generation.h b/include/neuron_generation.h
index d9cddac..09ce2ab 100644
--- a/include/neuron_generation.h
+++ b/include/neuron_generation.h
@@ -696,10 +696,11 @@ void SearchThreadFunc(
  * между несколькими потоками. Каждый поток исследует
  * случайные комбинации параметров нейронов независимо.
  *
- * Ключевая идея: каждый поток выполняет ПОЛНОЕ количество
- * итераций (count_max), что увеличивает общее количество
- * исследованных комбинаций пропорционально числу потоков.
- * Это обеспечивает лучшее качество поиска при большей скорости.
+ * Стратегия распределения работы:
+ * - Общее количество итераций делится между потоками
+ * - Это обеспечивает приблизительно такое же качество поиска
+ *   как однопоточная версия, но за меньшее время
+ * - Каждый поток имеет минимальное гарантированное количество итераций
  *
  * @return минимальная достигнутая ошибка, или big если не найдено
  */
@@ -715,26 +716,24 @@ float rndrod4_parallel() {
     // Минимальное количество итераций на поток для качественного поиска.
     // При слишком малом количестве итераций случайный поиск может
     // не найти хорошее решение из-за недостаточного исследования
-    // пространства параметров.
-    const int MIN_ITERATIONS_PER_THREAD = 100;
-
-    // Используем однопоточную версию если общее количество итераций
-    // слишком мало для эффективного распределения между потоками.
-    // Порог = MIN_ITERATIONS_PER_THREAD * NumThreads
-    // Это гарантирует, что каждый поток получит минимум MIN_ITERATIONS_PER_THREAD итераций.
-    int min_total_iterations = MIN_ITERATIONS_PER_THREAD * NumThreads;
-    if (count_max < min_total_iterations) {
+    // пространства параметров. Значение 1000 обеспечивает достаточное
+    // покрытие пространства поиска на каждом потоке.
+    const int MIN_ITERATIONS_PER_THREAD = 1000;
+
+    // Вычисляем количество итераций на поток
+    // Общая работа делится между потоками, но каждый поток получает
+    // минимум MIN_ITERATIONS_PER_THREAD итераций
+    int base_iterations_per_thread = (count_max + NumThreads - 1) / NumThreads;
+    int iterations_per_thread = std::max(base_iterations_per_thread, MIN_ITERATIONS_PER_THREAD);
+
+    // Используем однопоточную версию если count_max слишком мал,
+    // чтобы параллелизация имела смысл. Порог: нужно достаточно
+    // итераций чтобы каждый поток мог эффективно работать.
+    // При count_max < 2000 накладные расходы на потоки превышают выгоду.
+    if (count_max < 2000) {
         return rndrod4();
     }
 
-    // Каждый поток выполняет ПОЛНОЕ количество итераций (count_max),
-    // что увеличивает общее количество исследованных комбинаций
-    // в NumThreads раз. Это обеспечивает:
-    // 1. Лучшее качество поиска (больше комбинаций исследовано)
-    // 2. Эффективное использование всех доступных ядер
-    // 3. Масштабируемость: больше потоков = больше исследованных комбинаций
-    int iterations_per_thread = count_max;
-
     // Создаём результаты для каждого потока
     vector<ThreadSearchResult> results(NumThreads);
 

From fb7a454ae1581f52ff876595aa02952db2107f68 Mon Sep 17 00:00:00 2001
From: konard <drakonard@gmail.com>
Date: Tue, 27 Jan 2026 21:49:40 +0100
Subject: [PATCH 4/4] Revert "Initial commit with task details"

This reverts commit db43ed22142410efe28ed772005022c9d2ae7b47.
---
 CLAUDE.md | 13 -------------
 1 file changed, 13 deletions(-)

diff --git a/CLAUDE.md b/CLAUDE.md
index aa17835..043e473 100644
--- a/CLAUDE.md
+++ b/CLAUDE.md
@@ -5,16 +5,3 @@ Your forked repository: konard/netkeep80-NNets
 Original repository (upstream): netkeep80/NNets
 
 Proceed.
-
----
-
-Issue to solve: https://github.com/netkeep80/NNets/issues/21
-Your prepared branch: issue-21-538542164f70
-Your prepared working directory: /tmp/gh-issue-solver-1769545380723
-Your forked repository: konard/netkeep80-NNets
-Original repository (upstream): netkeep80/NNets
-
-Proceed.
-
-
-Run timestamp: 2026-01-27T20:23:07.478Z
\ No newline at end of file