ramanujan_db/pool_handler.py at main · itaybthl/ramanujan_db · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
from multiprocessing import Pool, Manager, Value
import importlib
from dataclasses import dataclass
import time
import math
import os
import logging
import logging.config
import threading

LOGGER_NAME = 'job_logger'

COOLDOWN = 'cooldown'
DEFAULT_COOLDOWN = 1

@dataclass
class Message:
    is_kill_message: bool
    module_path: str
    parameters: list

    @staticmethod
    def get_kill_message():
        return Message(True, '', [])

    @staticmethod
    def get_execution_message(module_path, parameters):
        return Message(False, module_path, parameters)

def import_module(module_path):
    return importlib.import_module(module_path)

def callback_wrapper(queue):
    def callback(result):
        queue.put(result)
    return callback

class WorkerPool:
    def __init__(self, pool_size=0):
        logging.config.fileConfig('logging.config', defaults={'log_filename': 'pool'})
        self.manager = Manager()
        self.running = self.manager.Value('i', 0)
        self.job_queue = self.manager.Queue()
        if pool_size != 0:
            self.pool = Pool(pool_size)
        else:
            self.pool = Pool()
        self.result_queues = {}
        self.main_jobs = 0

    def stop(self):
        self.running.value = 0

    def start(self, modules):
        self.main_jobs = len(modules)
        self.running.value = 1
        results = []

        for module_path, module_config in modules.items():
            self.result_queues[module_path] = self.manager.Queue()
            async_result = self.pool.apply_async(
                    WorkerPool.run_job,
                    (self.running, self.job_queue, self.result_queues[module_path], module_path, module_config)
                    )
            results.append(async_result)

        self.read_queue()

        return [result.get() for result in results]

    def read_queue(self):
        while self.main_jobs != 0:
            while self.job_queue.empty():
                time.sleep(2)
            message = self.job_queue.get()

            if message.is_kill_message:
                self.main_jobs -= 1
                logging.getLogger(LOGGER_NAME).info('Got kill message')
                continue

            else:
                self.pool.apply_async(WorkerPool.run_sub_job, (message.module_path, message.parameters), callback=callback_wrapper(self.result_queues[message.module_path]))
        self.pool.close()
        self.pool.join()

    @staticmethod
    def run_module(module, module_path, job_queue, result_queue, run_async, async_cores, split_async, args):
        try:
            if not hasattr(module, 'run_query'):
                module.execute_job(**args)
                return True
            queried_data = module.run_query(**args)
            if not any(queried_data):
                return False
            if not run_async:
                results = [module.execute_job(queried_data)]
            else:
                async_cores = async_cores if async_cores != 0 else os.cpu_count()
                if split_async:
                    queried_data = WorkerPool.split_parameters(queried_data, async_cores)
                for queried_chunk in queried_data:
                    message = Message.get_execution_message(module_path, queried_chunk)
                    job_queue.put(message)
                results = []
                while len(results) != len(queried_data):
                    results.append(result_queue.get())
            module.summarize_results(results)
            return True
        except Exception as ex:
            logging.getLogger(LOGGER_NAME).info(f'There was an error while running the module {module_path}: {ex}')
            return False

    @staticmethod
    def run_job(running, job_queue, result_queue, module_path, module_config):
        module = import_module(module_path)
        args = module_config['args']
        timings = []
        iterations = module_config.get('iterations', math.inf)
        run_async = module_config.get('run_async', False)
        async_cores = module_config.get('async_cores', 0)
        split_async = module_config.get('split_async', True)
        cooldown = module_config.get(COOLDOWN, DEFAULT_COOLDOWN)
        no_work_timeout = module_config.get('no_work_timeout', -1)
        iteration = 0
        while running.value and iteration < iterations:
            start_time = time.time()
            worked = WorkerPool.run_module(module, module_path, job_queue, result_queue, run_async, async_cores, split_async, args)
            if worked and len(timings) < 30:
                timings.append(time.time() - start_time)
            iteration += 1
            if not worked:
                if no_work_timeout == -1:
                    break
                else:
                    time.sleep(no_work_timeout)
            else:
                time.sleep(cooldown)

        message = Message.get_kill_message()
        job_queue.put(message)
        return module_path, timings

    @staticmethod
    def run_sub_job(module_path, parameters):
        module = import_module(module_path)
        if parameters:
            result = module.execute_job(parameters)
        else:
            result = module.execute_job()
        return result

    @staticmethod
    def split_parameters(parameters, pool_size):
        chunk_size = max(len(parameters) // pool_size, 1)
        return [parameters[i:i+chunk_size] for i in range(0, len(parameters), chunk_size)]