diff --git a/RiskLabAI/features/feature_importance/swefi/__init__.py b/RiskLabAI/features/feature_importance/swefi/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/RiskLabAI/features/feature_importance/swefi/stability_weighted_ensemble_feature_importance.py b/RiskLabAI/features/feature_importance/swefi/stability_weighted_ensemble_feature_importance.py
new file mode 100644
index 0000000..3f289da
--- /dev/null
+++ b/RiskLabAI/features/feature_importance/swefi/stability_weighted_ensemble_feature_importance.py
@@ -0,0 +1,535 @@
+import pandas as pd
+import numpy as np
+from enum import Enum
+from tqdm.notebook import tqdm
+from numpy.random import RandomState
+from collections import Counter
+import itertools
+import sklearn.metrics as Metrics
+from sklearn.preprocessing import minmax_scale
+from pycaret.classification import ClassificationExperiment
+from sklearn.model_selection import StratifiedKFold 
+from arch.bootstrap import optimal_block_length
+from arch.bootstrap import StationaryBootstrap, CircularBlockBootstrap, MovingBlockBootstrap, IndependentSamplesBootstrap, IIDBootstrap
+from sklearn.inspection import permutation_importance
+from sklearn.feature_selection import mutual_info_classif, f_classif
+from scipy.stats import pearsonr, kendalltau
+
+from sklearn.feature_selection import RFE, RFECV
+
+from sklearn.svm import SVC
+
+def feature_importance_linear_models(
+    classifier,
+    X, y,
+) -> pd.DataFrame:
+    classifier.fit(X, y)
+    coefficients_importances = np.abs(classifier.coef_).mean(axis=0)
+    coefficients_importances = pd.Series(coefficients_importances, classifier.feature_names_in_)
+
+    importances_scaled = minmax_scale(
+        coefficients_importances,
+        feature_range=(0, 1),
+        axis=0,
+    )
+
+    return pd.Series(importances_scaled, index=coefficients_importances.index)
+
+
+def feature_importance_sklearn(
+    classifier,
+    X, y,
+) -> pd.DataFrame:
+    classifier.fit(X, y)
+    importances = pd.Series(classifier.feature_importances_, index=classifier.feature_names_in_)
+    
+    importances = pd.concat({
+        "Mean": importances.mean(),
+    }, axis=1)
+
+    importances_scaled = minmax_scale(
+        importances["Mean"],
+        feature_range=(0, 1),
+        axis=0,
+    )
+
+    return pd.Series(importances_scaled, index=importances.index)
+
+
+def feature_importance_RFE(
+    classifier,
+    X,
+    y,
+) -> pd.DataFrame:
+    rfe = RFE(
+        estimator=classifier,
+        verbose=0,
+        n_features_to_select=1,    
+    )
+
+    rfe.fit(X, y)
+
+    inverted_ranking = np.max(rfe.ranking_) - rfe.ranking_ + 1
+
+    normalized_importance = minmax_scale(inverted_ranking)
+
+    return pd.Series(normalized_importance, index=rfe.feature_names_in_)
+
+def feature_importance_SFI(
+    classifier,
+    X,
+    y,
+    n_splits: int = 5,
+    score_sample_weights: list = None,  
+    train_sample_weights: list = None, 
+) -> pd.DataFrame:
+
+    if train_sample_weights is None:
+        train_sample_weights = np.ones(X.shape[0])
+    if score_sample_weights is None:
+        score_sample_weights = np.ones(X.shape[0])
+
+    cv_generator = StratifiedKFold(n_splits=n_splits)
+    feature_names = X.columns
+    importances = []
+    for feature_name in feature_names:
+        scores = []
+
+        for train, test in cv_generator.split(X, y):
+            x_train, y_train, weights_train = X.iloc[train, :][[feature_name]], y.iloc[train], train_sample_weights[train]
+            x_test, y_test, weights_test = X.iloc[test, :][[feature_name]], y.iloc[test], score_sample_weights[test]
+
+            feature_train, label_train, sample_weights_train = (
+                x_train, y_train, weights_train,
+            )
+
+            feature_test, label_test, sample_weights_test = (
+                x_test, y_test, weights_test,
+            )
+
+            try:
+                classifier.fit(feature_train, label_train, sample_weight=sample_weights_train)
+            except:
+                classifier.fit(feature_train, label_train)
+
+            prediction = classifier.predict(feature_test)
+            score = Metrics.accuracy_score(label_test, prediction, sample_weight=sample_weights_test)
+            scores.append(score)
+
+        importances.append({
+            "FeatureName": feature_name,
+            "Mean": np.mean(scores),
+        })
+
+    importances = pd.DataFrame(importances)
+    importances_scaled = minmax_scale(
+        importances["Mean"],
+        feature_range=(0, 1),
+        axis=0,
+    )
+
+    return pd.Series(importances_scaled, index=importances.FeatureName)
+
+
+def feature_importance_MDI(classifier, X, y):
+    classifier.fit(X, y)
+    importances = pd.Series(classifier.feature_importances_, index=classifier.feature_names_in_)
+    
+    importances_scaled = minmax_scale(
+        importances,
+        feature_range=(0, 1),
+        axis=0,
+    )
+
+    return pd.Series(importances_scaled, index=importances.index)
+
+def feature_importance_MDA(
+    classifier,
+    X: pd.DataFrame,
+    y: pd.DataFrame,
+    n_repeats: int = 5,
+) -> pd.DataFrame:
+
+    classifier.fit(X, y)
+    importances = permutation_importance(classifier, X, y, n_repeats=n_repeats, random_state=43).importances_mean
+
+    importances = minmax_scale(
+        importances,
+        feature_range=(0, 1),
+        axis=0,
+    )
+
+    return pd.Series(importances, index=X.columns)
+
+class UAMeasure(Enum):
+    SPEARMAN = "Spearman"
+    PEARSON = "Pearson"
+    KENDAL_TAU = "Kendal-Tau"
+    MUTUAL_INFORMATION = "Mutual Information"
+    ANOVA_F = "ANOVA F-Stat"
+
+def feature_importance_univariate_analysis(measurements, X, y):
+    ua = pd.DataFrame(
+        data=None,
+        index=X.columns
+    )
+
+    if UAMeasure.SPEARMAN.value in measurements:
+        spearmans = minmax_scale(X.apply(lambda feature: (np.abs(np.corrcoef(feature, y)[0, 1])), axis=0))
+        ua[UAMeasure.SPEARMAN.value] = spearmans
+
+    if UAMeasure.PEARSON.value in measurements:
+        pearsons = minmax_scale(X.apply(lambda feature: np.abs(pearsonr(feature, y).statistic), axis=0))
+        ua[UAMeasure.PEARSON.value] = pearsons
+        
+    if UAMeasure.KENDAL_TAU.value in measurements:
+        kendalltaus = minmax_scale(X.apply(lambda feature: np.abs(kendalltau(feature, y).statistic), axis=0))
+        ua[UAMeasure.KENDAL_TAU.value] = kendalltaus
+
+    if UAMeasure.MUTUAL_INFORMATION.value in measurements:
+        mutual_informations = minmax_scale(mutual_info_classif(X, y, n_neighbors=51))
+        ua[UAMeasure.MUTUAL_INFORMATION.value] = mutual_informations
+
+    if UAMeasure.ANOVA_F.value in measurements:
+        f_values = minmax_scale(f_classif(X, y)[0])
+        ua[UAMeasure.ANOVA_F.value] = f_values
+    
+    return ua
+
+def full_name(klass):
+    return ".".join([klass.__module__, klass.__name__])
+
+class FIModel(Enum):
+    COEFFICIENT_BASED = "Coefficient-Based + Shrinkage & Selection"
+    TREE_BASED = "Tree-Based"
+    PERMUTATION_BASED = "Permutation-Based"
+    SINGLE_FEATURE_BASED = "Signle Feature-Based"
+    RFE_BASED = "Recursive Feature Elimination-Based"
+
+class SWEFI:
+    def __init__(self, X, y, n_fold=10):
+
+        self.percentage = None
+        self.clfx = ClassificationExperiment()
+        self.clfx.setup(data = X, target = y, fold=n_fold, train_size=0.99, session_id = 123, n_jobs = -1, normalize=True, normalize_method='zscore')
+        self.X = X
+        self.y = y
+
+    def select_models(self, select_n_model=None):
+        model_to_methods = self.clfx.models()
+
+        model_to_methods['FI Methods'] = pd.Series({
+            'lr': [FIModel.COEFFICIENT_BASED.value, FIModel.PERMUTATION_BASED.value, FIModel.SINGLE_FEATURE_BASED.value, FIModel.RFE_BASED.value],
+            'knn': [FIModel.PERMUTATION_BASED.value, ],
+            'nb': [FIModel.SINGLE_FEATURE_BASED.value],
+            'dt': [FIModel.SINGLE_FEATURE_BASED.value],
+            'svm': [FIModel.COEFFICIENT_BASED.value, FIModel.PERMUTATION_BASED.value,], 
+            'rbfsvm': [FIModel.PERMUTATION_BASED.value,],
+            'gpc': [FIModel.PERMUTATION_BASED.value,],
+            'mlp': [FIModel.PERMUTATION_BASED.value,],
+            'ridge': [FIModel.COEFFICIENT_BASED.value, FIModel.PERMUTATION_BASED.value, FIModel.SINGLE_FEATURE_BASED.value, FIModel.RFE_BASED.value],
+            'rf': [FIModel.TREE_BASED.value, FIModel.RFE_BASED.value],
+            'qda': [FIModel.PERMUTATION_BASED.value, ],
+            'ada': [FIModel.PERMUTATION_BASED.value, ],
+            'gbc': [FIModel.PERMUTATION_BASED.value, ],
+            'lda': [FIModel.COEFFICIENT_BASED.value, FIModel.PERMUTATION_BASED.value, FIModel.SINGLE_FEATURE_BASED.value, FIModel.RFE_BASED.value],
+            'et': [FIModel.TREE_BASED.value, FIModel.RFE_BASED.value],
+            'xgboost': [FIModel.TREE_BASED.value, FIModel.RFE_BASED.value ],
+            'lightgbm': [FIModel.PERMUTATION_BASED.value,],
+            'dummy': [FIModel.PERMUTATION_BASED.value],
+        })
+
+        model_to_methods = model_to_methods[['Reference', 'FI Methods']].set_index('Reference').squeeze().to_dict()
+        
+        model_to_methods.update({
+            "sklearn.svm._classes.SVC": [FIModel.COEFFICIENT_BASED.value, FIModel.RFE_BASED.value],
+        })
+        
+        self.model_to_methods = model_to_methods
+
+        exclude = set(['dummy', 'svm', 'knn', 'nb', 'lightgbm', 'ada', 'gpc', 'rbfsvm'])
+        all_models = set(self.clfx.models().index.tolist()) 
+        external_models = [SVC(probability=True, kernel='linear'), ]
+
+        include = list(all_models - exclude) + external_models
+        
+        if type(select_n_model) == float:
+            self.learning_models = self.clfx.compare_models(n_select=round(len(self.clfx.models()) * select_n_model),
+                                                             include=include,
+                                                             )
+        else:
+            self.learning_models = self.clfx.compare_models(n_select=select_n_model,
+                                                             include=include,
+                                                             )
+            
+        return self
+
+    def select_univariate_analysis_measurements(self, measurements=['Pearson', 'Spearman', 'Kendal']):
+        self.measurements = measurements
+
+        return self
+
+    def fine_tune_selected_models(self, hpo_n_fold=4, hpo_n_iter=25, hpo_metric = 'Accuracy', hpo_search_library = 'scikit-optimize', hpo_search_algorithm = 'bayesian'):
+        learning_models = self.learning_models
+        model_to_methods = self.model_to_methods
+
+
+        model_to_custom_config = {
+            "sklearn.ensemble._forest.ExtraTreesClassifier": None,
+            "sklearn.neighbors._classification.KNeighborsClassifier": None,
+            "sklearn.ensemble._forest.RandomForestClassifier": None,
+            "xgboost.sklearn.XGBClassifier": None,
+            "lightgbm.sklearn.LGBMClassifier": {},
+            "sklearn.neural_network._multilayer_perceptron.MLPClassifier": None,
+            "sklearn.ensemble._gb.GradientBoostingClassifier": {},
+            "sklearn.naive_bayes.GaussianNB": {},
+            "sklearn.ensemble._weight_boosting.AdaBoostClassifier": {},
+            "sklearn.linear_model._ridge.RidgeClassifier": {
+                "alpha": [1],
+                "solver": ["lsqr"],
+            },
+            "sklearn.discriminant_analysis.LinearDiscriminantAnalysis": {
+                "shrinkage": [0.0,],
+                "solver": ["lsqr"],
+            },
+            "sklearn.linear_model._logistic.LogisticRegression": {
+                "C": [1,],
+                "solver": ['liblinear'],
+            },
+            "sklearn.discriminant_analysis.QuadraticDiscriminantAnalysis": {},
+            "sklearn.tree._classes.DecisionTreeClassifier": None,
+            "sklearn.svm._classes.SVC": {
+                'probability': [True, ],
+                'C': [1.0],
+                'kernel': [
+                    "linear",
+                ],
+            },
+        }
+
+        tuned_learning_models = []
+        for model in learning_models:
+            if model_to_custom_config[full_name(model.__class__)] is None:
+                tlm, tuner = self.clfx.tune_model(
+                    model,
+                    return_tuner=True,
+                    fold=hpo_n_fold, 
+                    verbose=True, 
+                    tuner_verbose=True, 
+                    optimize=hpo_metric, 
+                    search_library=hpo_search_library, search_algorithm=hpo_search_algorithm,
+                    n_iter=hpo_n_iter,
+                    choose_better=True
+                )
+
+            elif len(model_to_custom_config[full_name(model.__class__)]) == 0:
+                tlm = model
+
+            else:
+                tlm, tuner = self.clfx.tune_model(
+                    model,
+                    return_tuner=True,
+                    fold=hpo_n_fold, 
+                    verbose=True, 
+                    tuner_verbose=True, 
+                    optimize=hpo_metric, 
+                    search_library='scikit-learn', search_algorithm='grid',
+                    custom_grid=model_to_custom_config[full_name(model.__class__)], 
+                    n_iter=hpo_n_iter,
+                    choose_better=True
+                )
+
+
+            tuned_learning_models.append(tlm)
+
+        self.finalized_tuned_learning_models = [self.clfx.finalize_model(estimator=tlm, model_only=True,) for tlm in tuned_learning_models]
+
+        model_method_pairs = []
+
+        for tlm in tuned_learning_models:
+            methods = model_to_methods[full_name(tlm.__class__)]
+            for method in methods:
+                model_method_pairs.append((tlm, method))
+
+        self.model_method_pairs = model_method_pairs
+        
+        return self
+
+    def _initialize_model_feature_importance_data(self, models, n_iteration=5):
+        feature_names = self.X.columns
+        index_columns = ["Model Name", "Feature Importance Model", "Subset Index"]
+        to_apply_product_list = [
+            models,
+            [i for i in range(n_iteration)],
+        ]
+        tuples = [(type(model).__name__, proper_fi_model, iteration) for (model, proper_fi_model), iteration in
+                  itertools.product(*to_apply_product_list)]
+        
+        index = pd.MultiIndex.from_tuples(
+            tuples,
+            names=index_columns
+        )
+
+        data = pd.DataFrame({}, columns=feature_names, index=index)
+        return data, index
+    
+    def _initialize_univariate_analysis_feature_importance_data(self, measurements, n_iteration=5):
+        feature_names = self.X.columns
+        index_columns = ["Model Name", "Feature Importance Model", "Subset Index"]
+        to_apply_product_list = [
+            measurements,
+            [i for i in range(n_iteration)],
+        ]
+        tuples = [("Univariate Analysis", ua_measurement, iteration) for (ua_measurement), iteration in
+                  itertools.product(*to_apply_product_list)]
+        
+        index = pd.MultiIndex.from_tuples(
+            tuples,
+            names=index_columns
+        )
+
+        data = pd.DataFrame({}, columns=feature_names, index=index)
+        return data, index
+
+    @staticmethod
+    def stationary_bootstrap(X, y, n_iteration=5,):
+        optimal_block_size = round(optimal_block_length(X).mean(axis=0)["stationary"])
+        random_state = RandomState(1234)
+        bootstraper = StationaryBootstrap(optimal_block_size, X=X, y=y, random_state=random_state)
+        for bootstraped_data in bootstraper.bootstrap(n_iteration):
+            yield bootstraped_data[1]['X'], bootstraped_data[1]['y']
+
+    @staticmethod
+    def iid_bootstrap(X, y, n_iteration=5,):
+        random_state = RandomState(1234)
+        bootstraper = IIDBootstrap(X=X, y=y, random_state=random_state)
+        for bootstraped_data in bootstraper.bootstrap(n_iteration):
+            yield bootstraped_data[1]['X'], bootstraped_data[1]['y']
+
+    def compute_feature_importance_data(self, bootstrap_method, n_iteration=10, n_repeats=10):
+        X = self.X
+        y = self.y
+
+        X = (X-X.mean()) / X.std()
+
+        model_method_pairs = self.model_method_pairs
+        models_fi, models_index = self._initialize_model_feature_importance_data(model_method_pairs, n_iteration=n_iteration)
+
+        measurements = self.measurements
+        measurements_fi, measurements_index = self._initialize_univariate_analysis_feature_importance_data(measurements, n_iteration=n_iteration)
+
+        for iteration, (X_train, y_train) in tqdm(enumerate(
+            bootstrap_method(X, y, n_iteration)
+        ), total=n_iteration):
+
+            for model, proper_fi_model in model_method_pairs:
+
+                if proper_fi_model == FIModel.TREE_BASED.value:
+                    try:
+                        result = feature_importance_MDI(model, X_train, y_train, ).values
+                    except:
+                        result = feature_importance_sklearn(model, X_train, y_train,).values
+
+                elif proper_fi_model == FIModel.PERMUTATION_BASED.value:
+                    result = feature_importance_MDA(model, X_train, y_train, n_repeats=n_repeats).values
+
+                elif proper_fi_model == FIModel.COEFFICIENT_BASED.value:
+                    result = feature_importance_linear_models(model, X_train, y_train,).values
+
+                elif proper_fi_model == FIModel.SINGLE_FEATURE_BASED.value:
+                    result = feature_importance_SFI(model, X_train, y_train, n_splits=n_repeats).values
+                
+                elif proper_fi_model == FIModel.RFE_BASED.value:
+                    result = feature_importance_RFE(model, X_train, y_train,).values
+
+                # Normalize
+                result = (result - result.min()) / (result.max() - result.min()) 
+
+                models_fi.loc[type(model).__name__, proper_fi_model, iteration] = result
+
+            ua_result = feature_importance_univariate_analysis(measurements, X_train, y_train).T.values
+            measurements_fi.loc[pd.IndexSlice["Univariate Analysis", :, iteration]] = ua_result
+            
+        self.models_fi = models_fi
+        self.models_index = models_index
+
+        self.measurements_fi = measurements_fi
+        self.measurements_index = measurements_index
+
+        self.n_iterationn = n_iteration
+
+        return self
+    
+    def compute_swefi_scores(self, percentage=0.5, weight='linear'):
+        features = self.X.columns
+
+        fi = pd.concat([self.models_fi, self.measurements_fi])
+        index = self.models_index.tolist() + self.measurements_index.tolist()
+        k = round(len(features) * percentage)
+        important_features_together = []
+
+        for idx in index:
+            important_features_in_current_step = fi.loc[idx].squeeze().sort_values(ascending=False)[:k].index.tolist()
+            important_features_together.extend(important_features_in_current_step)
+
+        feature_ranked_as_k_top_important = dict(zip(features, [0] * len(features)))
+        n_times_that_feature_ranked_as_important = Counter(important_features_together)
+        dict.update(feature_ranked_as_k_top_important, n_times_that_feature_ranked_as_important)
+        feature_ranked_as_k_top_important = pd.Series(feature_ranked_as_k_top_important)
+        stability_scores = feature_ranked_as_k_top_important / (self.n_iterationn * (len(self.model_method_pairs) + len(self.measurements)))
+
+        if weight == 'linear':
+            weights = stability_scores
+            weights = weights / weights.sum()
+            swefi = (fi * weights)
+
+        elif weight == 'logarithmic':
+            weights = np.log(stability_scores + 1)
+            weights = weights / weights.sum()
+            swefi = (fi * weights)
+
+        elif weight == 'exponential':
+            weights = np.exp(stability_scores)
+            weights = weights / weights.sum()
+            swefi = (fi * weights) 
+
+        elif weight == 'harmonic':
+            swefi = (2 * fi * stability_scores) / (fi + stability_scores)
+
+        elif weight == 'power-2':
+            weights = stability_scores ** 2
+            weights = weights / weights.sum()
+            swefi = (fi * weights)
+
+        elif weight == 'power-0.5':
+            weights = (stability_scores ** 0.5)
+            weights = weights / weights.sum()
+            swefi = (fi * weights)
+
+        elif weight == 'entropy':
+            weights = (-stability_scores * np.log(stability_scores))
+            weights = weights / weights.sum()            
+            swefi = (fi * weights)
+
+        else:
+            raise NotImplementedError(f"Weight {weight} not implemented.")
+
+        swefi = pd.concat(
+            [swefi.mean() / swefi.mean().sum(), swefi.std() * (swefi.shape[0]) ** -0.5 / swefi.mean().sum()],
+            axis=1,
+        ).rename(columns={
+            0: 'mean(SWEFI)',
+            1: 'std(SWEFI)',
+        }).sort_values(by='mean(SWEFI)')
+
+        self.stability_scores = stability_scores
+        self.swefi = swefi
+        return self
+
+    def get_swefi_scores(self):
+        return self.swefi
+
+    def get_inner_models_feature_importances(self):
+        models_fi = self.models_fi.groupby(level=[0, 1]).sum()
+        models_fi = models_fi.div(models_fi.sum(axis=1).values, axis=0).transpose()
+        return models_fi
\ No newline at end of file
diff --git a/RiskLabAI/features/feature_importance/swefi/synthetic_dataset_generation.py b/RiskLabAI/features/feature_importance/swefi/synthetic_dataset_generation.py
new file mode 100644
index 0000000..f0a7c82
--- /dev/null
+++ b/RiskLabAI/features/feature_importance/swefi/synthetic_dataset_generation.py
@@ -0,0 +1,140 @@
+import numpy as np
+import pandas as pd
+import statsmodels.api as sm
+import sklearn.datasets as Datasets
+
+
+def generate_ar_time_series(n, ar_params, ma_params, sigma=1.0):
+    """
+    Generate an autoregressive (AR) time series.
+
+    Parameters:
+    - n: Length of the time series
+    - ar_params: List of AR parameters [phi1, phi2, ..., phi_p]
+    - sigma: Standard deviation of the white noise
+
+    Returns:
+    - time_series: Generated AR time series
+    """
+    # Create the AR coefficients for the model
+    ar = np.r_[1, -np.array(ar_params)]
+    ma = np.r_[1, np.array(ma_params)]
+
+    # Generate the ARMA process
+    arma_process = sm.tsa.ArmaProcess(ar, ma)
+    time_series = arma_process.generate_sample(nsample=n, scale=sigma)
+
+    return time_series
+
+
+def create_lagged_data(time_series, k):
+    """
+    Create a DataFrame with the time series and its k lags.
+
+    Parameters:
+    - time_series: The generated time series
+    - k: Number of lags
+
+    Returns:
+    - df: DataFrame containing the time series and its lags
+    """
+    data = {'y': time_series}
+    for i in range(1, k + 1):
+        data[f'lag_{i}'] = np.roll(time_series, i)
+
+    df = pd.DataFrame(data)
+    df = df.iloc[k:]  # Drop the initial rows with NaN values due to the roll
+
+    return df.to_numpy()
+
+def generate_cross_sectional_dataset(
+    n_informative: int = 5, 
+    n_redundant: int = 25,  
+    n_noise: int = 5, 
+    n_samples: int = 10000,  
+    random_state: int = 41,  
+    sigma_std: float = 0.1, 
+    n_clusters_per_class: int = 2,
+) -> tuple:
+    n_features = n_informative + n_redundant + n_noise
+    np.random.seed(random_state)
+    X, y = Datasets.make_classification(
+        n_samples=n_samples,
+        n_features=n_features-n_redundant,
+        n_informative=n_informative,
+        n_redundant=0,
+        shuffle=False,
+        random_state=random_state,
+        n_clusters_per_class=n_clusters_per_class,
+    )
+
+    columns = [f"I{i}" for i in range(n_informative)]
+    columns += [f"N{i}" for i in range(n_noise)]
+    X, y = pd.DataFrame(X, columns=columns), pd.Series(y)
+    i = np.random.choice(range(n_informative), size=n_redundant)
+    for k, j in enumerate(i):
+        X[f"R{k} (from I{j})"] = X[f"I{j}"] + np.random.normal(size=X.shape[0]) * sigma_std
+
+    return X, y
+
+def generate_multivariate_time_series_dataset(
+    n_informative: int = 10,  # number of informative features
+    n_redundant: int = 10,  # number of redundant features
+    n_noise: int = 20,
+    n_samples: int = 10000,  # number of sample to generate
+    n_time_steps: int = 2, # Two business years
+    random_state: int = 41,  # random state
+    sigma_std: float = 0.1,  # standard deviation of generation
+    time_series_params = [[0.3], [0.3], 0.1], # AR parameter (phi1)
+):
+    n_lag = n_time_steps - 1
+
+    informative_features = np.zeros(shape=(n_samples, n_informative, n_time_steps))
+    for k in range(n_informative):
+        time_series = generate_ar_time_series(n_samples + n_lag, time_series_params[0], time_series_params[1], 1)
+        informative_features[:, k, :] = create_lagged_data(time_series, n_lag)
+
+    np.random.seed(random_state)
+    i = np.random.choice(range(n_informative), size=n_redundant)
+    np.random.seed()
+    
+    linear_redundant_features = np.zeros((n_samples, n_redundant, n_time_steps))
+    linear_redundant_features_from_ = []
+
+    for k, j in enumerate(i):
+        linear_redundant_features[:, k, :] = informative_features[:, j, :] + np.random.normal(size=(n_samples, n_time_steps)) * sigma_std
+        linear_redundant_features_from_.append(j)
+
+    # Generate noise features
+    noise_features = np.zeros(shape=(n_samples, n_noise, n_time_steps))
+    for k in range(n_noise):
+        time_series = generate_ar_time_series(n_samples + n_lag, 0.5, 0.5, 1)
+        noise_features[:, k, :] = create_lagged_data(time_series, n_lag)
+
+    # Concatenate all features
+    X = np.concatenate([
+        informative_features,
+        linear_redundant_features,
+        noise_features],
+        axis=1)
+
+    columns = [f"I{i} lag{j}" for i in range(n_informative) for j in range(n_time_steps)]
+    columns += [f"R{i} from I{k} lag{j}" for i, k in enumerate(linear_redundant_features_from_) for j in range(n_time_steps)]
+    columns += [f"N{i} lag{j}" for i in range(n_noise) for j in range(n_time_steps)]
+
+    X = X.reshape((n_samples, -1))
+    X = pd.DataFrame(X, columns=columns)
+
+    I = X.iloc[:, :n_informative * n_time_steps]
+    I = (I - I.mean()) / I.std()
+    weights = np.ones(shape=len(I.columns))
+
+    # Calculate linear combination of features plus some noise
+    linear_combination = I @ weights
+    # Generate binary target variable based on probabilities
+    y = (linear_combination > 0).astype(int)
+
+    y = pd.Series(y)
+
+    return X, y
+