PART II B): German Credit Score Classification Model EXPLAINABILITY, BIAS & FAIRNESS (Gender as protected variable).

By: Krishna J¶

Importing necessary libraries ¶

#!pip install --upgrade tensorflow==1.15.0

import pandas as pd
import numpy as np
import seaborn               as sns
import matplotlib.pyplot     as plt
from sklearn.model_selection import train_test_split
#from sklearn.ensemble        import RandomForestClassifier
#from sklearn.linear_model    import LogisticRegression
from sklearn.preprocessing   import MinMaxScaler, StandardScaler
from sklearn.base            import TransformerMixin
from sklearn.pipeline        import Pipeline, FeatureUnion
from typing                  import List, Union, Dict
# Warnings will be used to silence various model warnings for tidier output
import warnings
warnings.filterwarnings('ignore')
%matplotlib inline 
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
np.random.seed(0)
#!pip install fairlearn
#!pip install aif360
#!pip install shap
#!pip install eli5
#!pip install BlackBoxAuditing

Importing source dataset ¶

German_df = pd.read_csv('C:/Users/krish/Downloads/German-reduced_upd.csv')

print(German_df.shape)
print (German_df.columns)

(1000, 11)
Index(['CurrentAcc_None', 'NumMonths', 'CreditHistory_Delay',
       'CreditHistory_none/paid', 'Collateral_savings/life_insurance',
       'CurrentAcc_GE200', 'Purpose_repairs', 'Purpose_radio/tv', 'Gender',
       'Age', 'CreditStatus'],
      dtype='object')

German_df.head()

#feature_list = ['Gender','Age','Marital_Status','NumMonths','Savings_<500','Savings_none','Dependents','Property_rent','Job_management/self-emp/officer/highly qualif emp','Debtors_guarantor','Purpose_CarNew',                           'Purpose_furniture/equip','CreditHistory_none/paid','Purpose_CarUsed','CreditAmount','CreditStatus']
feature_list=['CurrentAcc_None', 'NumMonths', 'CreditHistory_Delay',
       'CreditHistory_none/paid', 'Collateral_savings/life_insurance',
       'CurrentAcc_GE200', 'Purpose_repairs', 'Purpose_radio/tv', 'Gender',
       'Age', 'CreditStatus']

X = German_df.iloc[:, :-1]
y = German_df['CreditStatus']
X.head()
y.head()

0    1
1    0
2    1
3    1
4    0
Name: CreditStatus, dtype: int64

from imblearn.over_sampling import ADASYN from collections import Counter

ada = ADASYN(random_state=40) print('Original dataset shape {}'.format(Counter(y))) X_res, y_res = ada.fit_resample(X,y) print('Resampled dataset shape {}'.format(Counter(y_res)))

German_df=X = pd.DataFrame(np.column_stack((X_res, y_res)))

German_df.head()

German_df.columns=feature_list German_df.head()

Metrics to calculate model fairness necessary libraries ¶

from aif360.datasets import GermanDataset
from aif360.metrics import BinaryLabelDatasetMetric

def fair_metrics(fname, dataset, pred, pred_is_dataset=False):
    filename = fname
    if pred_is_dataset:
        dataset_pred = pred
    else:
        dataset_pred = dataset.copy()
        dataset_pred.labels = pred

    cols = ['Accuracy', 'F1', 'DI','SPD', 'EOD', 'AOD', 'ERD', 'CNT', 'TI']
    obj_fairness = [[1,1,1,0,0,0,0,1,0]]

    fair_metrics = pd.DataFrame(data=obj_fairness, index=['objective'], columns=cols)

    for attr in dataset_pred.protected_attribute_names:
        idx = dataset_pred.protected_attribute_names.index(attr)
        privileged_groups =  [{attr:dataset_pred.privileged_protected_attributes[idx][0]}]
        unprivileged_groups = [{attr:dataset_pred.unprivileged_protected_attributes[idx][0]}]

        classified_metric = ClassificationMetric(dataset,
                                                     dataset_pred,
                                                     unprivileged_groups=unprivileged_groups,
                                                     privileged_groups=privileged_groups)

        metric_pred = BinaryLabelDatasetMetric(dataset_pred,
                                                     unprivileged_groups=unprivileged_groups,
                                                     privileged_groups=privileged_groups)

        distortion_metric = SampleDistortionMetric(dataset,
                                                     dataset_pred,
                                                     unprivileged_groups=unprivileged_groups,
                                                     privileged_groups=privileged_groups)

        acc = classified_metric.accuracy()
        f1_sc = 2 * (classified_metric.precision() * classified_metric.recall()) / (classified_metric.precision() + classified_metric.recall())

        mt = [acc, f1_sc,
                        classified_metric.disparate_impact(),
                        classified_metric.mean_difference(),
                        classified_metric.equal_opportunity_difference(),
                        classified_metric.average_odds_difference(),
                        classified_metric.error_rate_difference(),
                        metric_pred.consistency(),
                        classified_metric.theil_index()
                    ]
        w_row = []
        print('Computing fairness of the model.')
        for i in mt:
            #print("%.8f"%i)
            w_row.append("%.8f"%i)
        with open(filename, 'a') as csvfile:
            csvwriter = csv.writer(csvfile)
            csvwriter.writerow(w_row)
        row = pd.DataFrame([mt],
                           columns  = cols,
                           index = [attr]
                          )
        fair_metrics = fair_metrics.append(row)
    fair_metrics = fair_metrics.replace([-np.inf, np.inf], 2)
    return fair_metrics

def get_fair_metrics_and_plot(fname, data, model, plot=False, model_aif=False):
    pred = model.predict(data).labels if model_aif else model.predict(data.features)
    fair = fair_metrics(fname, data, pred)
    if plot:
        pass

    return fair

def get_model_performance(X_test, y_true, y_pred, probs):
    accuracy = accuracy_score(y_true, y_pred)
    matrix = confusion_matrix(y_true, y_pred)
    f1 = f1_score(y_true, y_pred)
    return accuracy, matrix, f1

def plot_model_performance(model, X_test, y_true):
    y_pred = model.predict(X_test)
    probs = model.predict_proba(X_test)
    accuracy, matrix, f1 = get_model_performance(X_test, y_true, y_pred, probs)

Local file to load metric values¶

filename= 'C:/Users/krish/Downloads/main_pjt_final - Copy/may18/filename_mainpjt_results_gender_may18_upd.csv'

Converting data to aif compatible format¶

Since we are dealing with binary label dataset we are using aif360 class BiaryLabelDataset here with target label as CreditStatus and protected attributes as age,gender,marital status. Refer part 11 for more details on protected attributes and privileged classes.

# Fairness metrics
from aif360.metrics import BinaryLabelDatasetMetric
from aif360.explainers import MetricTextExplainer
from aif360.metrics import ClassificationMetric
# Get DF into IBM format
from aif360 import datasets
#converting to aif dataset
aif_dataset = datasets.BinaryLabelDataset(favorable_label = 1, unfavorable_label = 0, df=German_df,
                                                      label_names=["CreditStatus"],
                                                     protected_attribute_names=["Gender"],
                                              privileged_protected_attributes = [1])

#dataset_orig = GermanDataset(protected_attribute_names=['sex'],
#                            privileged_classes=[[1]],
#                            features_to_keep=['age', 'sex', 'employment', 'housing', 'savings', 'credit_amount', 'month', 'purpose'],
#                            custom_preprocessing=custom_preprocessing)

Splitting data to train and test sets¶

#privileged_groups = [{'Age':1},{' Gender': 1},{'Marital_Status':1}]
#unprivileged_groups = [{'Age':0},{'Gender': 0},{'Marital_Status':0}]

privileged_groups = [{'Gender': 1}]
unprivileged_groups = [{'Gender': 0}]

data_orig_train, data_orig_test = aif_dataset.split([0.8], shuffle=True)

X_train = data_orig_train.features
y_train = data_orig_train.labels.ravel()

X_test = data_orig_test.features
y_test = data_orig_test.labels.ravel()

X_train.shape
X_test.shape

(800, 10)

(200, 10)

data_orig_test.labels[:10].ravel()

array([1., 0., 1., 0., 1., 0., 1., 1., 1., 1.])

data_orig_train.labels[:10].ravel()

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 0.])

Testing bias with respect to protected variable¶

metric_orig_train = BinaryLabelDatasetMetric(data_orig_train, 
                                             unprivileged_groups=unprivileged_groups,
                                             privileged_groups=privileged_groups)
print("Difference in mean outcomes between unprivileged and privileged groups = %f" % metric_orig_train.mean_difference())

Difference in mean outcomes between unprivileged and privileged groups = -0.115809

A non zero value indicates bias.

Building ML model ¶

Considering ensemble models for our study.

1. RANDOM FOREST CLASSIFIER MODEL¶

#Seting the Hyper Parameters
param_grid = {"max_depth": [3,5,7, 10,None],
              "n_estimators":[3,5,10,25,50,150],
              "max_features": [4,7,15,20]}
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
#Creating the classifier
rf_model = RandomForestClassifier(random_state=40)
grid_search = GridSearchCV(rf_model, param_grid=param_grid, cv=5, scoring='recall', verbose=0)
model_rf = grid_search

mdl_rf = model_rf.fit(data_orig_train.features, data_orig_train.labels.ravel())

from sklearn.metrics import confusion_matrix
conf_mat_rf = confusion_matrix(data_orig_test.labels.ravel(), model_rf.predict(data_orig_test.features))
conf_mat_rf
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), model_rf.predict(data_orig_test.features)))

array([[  4,  59],
       [  1, 136]], dtype=int64)

0.7

unique, counts = np.unique(data_orig_test.labels.ravel(), return_counts=True)
dict(zip(unique, counts))

{0.0: 63, 1.0: 137}

1.a. Feature importance of model¶

importances = model_rf.best_estimator_.feature_importances_
indices = np.argsort(importances)
features = data_orig_train.feature_names
#https://stackoverflow.com/questions/48377296/get-feature-importance-from-gridsearchcv

importances

array([0.45669439, 0.21364021, 0.01568385, 0.09049872, 0.00545895,
       0.01824632, 0.00670235, 0.05110462, 0.04135576, 0.10061484])

importances[indices]

array([0.00545895, 0.00670235, 0.01568385, 0.01824632, 0.04135576,
       0.05110462, 0.09049872, 0.10061484, 0.21364021, 0.45669439])

features

['CurrentAcc_None',
 'NumMonths',
 'CreditHistory_Delay',
 'CreditHistory_none/paid',
 'Collateral_savings/life_insurance',
 'CurrentAcc_GE200',
 'Purpose_repairs',
 'Purpose_radio/tv',
 'Gender',
 'Age']

plt.figure(figsize=(20,30))
plt.title('Feature Importances')
plt.barh(range(len(indices)), importances[indices], color='b', align='center')
plt.yticks(range(len(indices)), [features[i] for i in indices])
plt.xlabel('Relative Importance')
plt.show()

<Figure size 1440x2160 with 0 Axes>

Text(0.5, 1.0, 'Feature Importances')

<BarContainer object of 10 artists>

([<matplotlib.axis.YTick at 0x2551c4a0c48>,
  <matplotlib.axis.YTick at 0x2551c4a4648>,
  <matplotlib.axis.YTick at 0x2551c4abfc8>,
  <matplotlib.axis.YTick at 0x2551c4f7ec8>,
  <matplotlib.axis.YTick at 0x2551c4f7748>,
  <matplotlib.axis.YTick at 0x2551c4e1f08>,
  <matplotlib.axis.YTick at 0x2551c4f7a08>,
  <matplotlib.axis.YTick at 0x2551c4fed88>,
  <matplotlib.axis.YTick at 0x2551c4fec08>,
  <matplotlib.axis.YTick at 0x2551c51dac8>],
 [Text(0, 0, 'Collateral_savings/life_insurance'),
  Text(0, 0, 'Purpose_repairs'),
  Text(0, 0, 'CreditHistory_Delay'),
  Text(0, 0, 'CurrentAcc_GE200'),
  Text(0, 0, 'Gender'),
  Text(0, 0, 'Purpose_radio/tv'),
  Text(0, 0, 'CreditHistory_none/paid'),
  Text(0, 0, 'Age'),
  Text(0, 0, 'NumMonths'),
  Text(0, 0, 'CurrentAcc_None')])

Text(0.5, 0, 'Relative Importance')

1.b. Model Explainability/interpretability¶

1.b.1 Using SHAP (SHapley Additive exPlanations)¶

import shap

Test data interpretation¶

rf_explainer = shap.KernelExplainer(model_rf.predict, data_orig_test.features)
rf_shap_values = rf_explainer.shap_values(data_orig_test.features,nsamples=50)
#https://towardsdatascience.com/explain-any-models-with-the-shap-values-use-the-kernelexplainer-79de9464897a

Using 200 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

rf_shap_values

array([[-0.09145515, -0.05341869,  0.        , ...,  0.06919924,
         0.10000652, -0.0950095 ],
       [ 0.        , -0.02772054,  0.        , ...,  0.01111922,
         0.00604221,  0.03555911],
       [ 0.        ,  0.0130656 ,  0.        , ...,  0.00600523,
         0.00119922,  0.0090243 ],
       ...,
       [ 0.00903226,  0.01234167,  0.        , ..., -0.00694954,
         0.00357798,  0.00699763],
       [ 0.        ,  0.00358795,  0.00033193, ..., -0.00836003,
         0.00382242,  0.01152767],
       [ 0.        , -0.04180513,  0.        , ..., -0.01309524,
         0.        ,  0.07241472]])

rf_explainer.expected_value

0.9749999999999999

y_test_predict=model_rf.predict(data_orig_test.features)
y_test_predict[:12]
data_orig_test.labels[:12].ravel()
data_orig_test.features[:2,:]

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

array([1., 0., 1., 0., 1., 0., 1., 1., 1., 1., 1., 1.])

array([[ 0., 36.,  0.,  1.,  0.,  1.,  0.,  1.,  1.,  0.],
       [ 0., 36.,  0.,  1.,  0.,  0.,  0.,  1.,  1.,  1.]])

y_test_predict.mean()

0.975

The explainer expected value is the average model predicted value on input data. Shapely helps to understand how individual features impact the output of each individual instance. The shapely values are model predicted values which may not coincide with actual y test values due to prediction error.

link=”logit” argument converts the logit values to probability

shap.initjs()
shap.force_plot(rf_explainer.expected_value,rf_shap_values[0],data_orig_test.features[0],data_orig_test.feature_names,link='logit')
#https://github.com/slundberg/shap
#https://github.com/slundberg/shap/issues/279
#https://github.com/slundberg/shap/issues/977
shap.initjs()
shap.force_plot(rf_explainer.expected_value,rf_shap_values[0],data_orig_test.features[0],data_orig_test.feature_names)

Features in blue pushes the base value towards lowest values and features in red moves base levels towards higher values.

Shapley values calculate the importance of a feature by comparing what a model predicts with and without the feature. However, since the order in which a model sees features can affect its predictions, this is done in every possible order, so that the features are fairly compared.

The SHAP plot shows features that contribute to pushing the output from the base value (average model output) to the actual predicted value.

shap.initjs()
shap.force_plot(rf_explainer.expected_value,rf_shap_values[1], data_orig_test.features[1],data_orig_test.feature_names,link='logit')
shap.initjs()
shap.force_plot(rf_explainer.expected_value,rf_shap_values[1], data_orig_test.features[1],data_orig_test.feature_names)

data_orig_test.feature_names

['CurrentAcc_None',
 'NumMonths',
 'CreditHistory_Delay',
 'CreditHistory_none/paid',
 'Collateral_savings/life_insurance',
 'CurrentAcc_GE200',
 'Purpose_repairs',
 'Purpose_radio/tv',
 'Gender',
 'Age']

shap.force_plot(rf_explainer.expected_value,
                rf_shap_values, data_orig_test.features[:,:],feature_names = data_orig_test.feature_names)

https://medium.datadriveninvestor.com/improving-the-classification-with-tuning-of-pipelines-and-ensemble-models-and-xai-eb69eb60dbfb

p = shap.summary_plot(rf_shap_values, data_orig_test.features, feature_names=data_orig_test.feature_names,plot_type="bar") 
display(p)

None

Variables with higher impact are displayed at the credit history, credit amount,num of months.

shap.decision_plot(rf_explainer.expected_value, rf_shap_values,feature_names=data_orig_test.feature_names)

The x-axis represents the model's output. In this case, the units are log odds.
The plot is centered on the x-axis at explainer.expected_value.
All SHAP values are relative to the model's expected value like a linear model's effects are relative to the intercept.
The y-axis lists the model's features.
By default, the features are ordered by descending importance. The importance is calculated over the observations plotted. This is usually different than the importance ordering for the entire dataset.
In addition to feature importance ordering, the decision plot also supports hierarchical cluster feature ordering and user-defined feature ordering.
Each observation's prediction is represented by a colored line. At the top of the plot, each line strikes the x-axis at its corresponding observation's predicted value. This value determines the color of the line on a spectrum.
Moving from the bottom of the plot to the top, SHAP values for each feature are added to the model's base value. This shows how each feature contributes to the overall prediction.
At the bottom of the plot, the observations converge at explainer.expected_value https://slundberg.github.io/shap/notebooks/plots/decision_plot.html

Like the force plot, the decision plot supports link='logit' to transform log odds to probabilities.

shap.decision_plot(rf_explainer.expected_value, rf_shap_values,feature_names=data_orig_test.feature_names,link='logit')

shap.plots._waterfall.waterfall_legacy(rf_explainer.expected_value, rf_shap_values[0],feature_names=data_orig_test.feature_names)

For first instace of input,out of all the displayed variables, CreditHistory is playing major role is pushing the target variable outcome towards predicting 1.

Interpretation of graph: https://shap.readthedocs.io/en/latest/example_notebooks/overviews/An%20introduction%20to%20explainable%20AI%20with%20Shapley%20values.html

f(x)- model output impacted by features; E(f(x))- expected output.

One the fundemental properties of Shapley values is that they always sum up to the difference between the game outcome when all players are present and the game outcome when no players are present. For machine learning models this means that SHAP values of all the input features will always sum up to the difference between baseline (expected) model output and the current model output for the prediction being explained.

Shapley values calculate the importance of a feature by comparing what a model predicts with and without the feature. However, since the order in which a model sees features can affect its predictions, this is done in every possible order, so that the features are fairly compared. https://medium.com/@gabrieltseng/interpreting-complex-models-with-shap-values-1c187db6ec83

shap.plots._waterfall.waterfall_legacy(rf_explainer.expected_value, rf_shap_values[1],feature_names=data_orig_test.feature_names)

For second instace of input,out of all the displayed variables, credit history is playing major role is pushing the target variable outcome towards predicting 1.

1.b.2 Using ELI5¶

#!pip install eli5
import eli5

from eli5.sklearn import PermutationImportance

https://towardsdatascience.com/explainable-artificial-intelligence-part-3-hands-on-machine-learning-model-interpretation-e8ebe5afc608

perm_rf = PermutationImportance(mdl_rf).fit(data_orig_test.features, data_orig_test.labels.ravel())

Feature Importance¶

perm_imp_1=eli5.show_weights(perm_rf,feature_names = data_orig_test.feature_names)
perm_imp_1
plt.show()

eli5 provides a way to compute feature importances for any black-box estimator by measuring how score decreases when a feature is not available; the method is also known as “permutation importance” or “Mean Decrease Accuracy (MDA)”.

The first number in each row shows how much model performance decreased with a random shuffling (in this case, using "accuracy" as the performance metric).
Like most things in data science, there is some randomness to the exact performance change from a shuffling a column. We measure the amount of randomness in our permutation importance calculation by repeating the process with multiple shuffles. The number after the ± measures how performance varied from one-reshuffling to the next.
You'll occasionally see negative values for permutation importances. In those cases, the predictions on the shuffled (or noisy) data happened to be more accurate than the real data. This happens when the feature didn't matter (should have had an importance close to 0), but random chance caused the predictions on shuffled data to be more accurate. This is more common with small datasets, like the one in this example, because there is more room for luck/chance.

https://www.kaggle.com/dansbecker/permutation-importance

1.c. Measuring fairness ¶

Of Baseline model ¶

import pandas as pd
import csv
import os
import numpy as np
import sys
from aif360.metrics import *
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, roc_curve, auc
plot_model_performance(mdl_rf, X_test, y_test)

fair_rf = get_fair_metrics_and_plot(filename, data_orig_test, mdl_rf)
fair_rf

Computing fairness of the model.

type(data_orig_train)

aif360.datasets.binary_label_dataset.BinaryLabelDataset

PRE PROCESSING¶

### Reweighing
from aif360.algorithms.preprocessing import Reweighing

RW_rf = Reweighing(unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups)

data_transf_train_rf_rw = RW_rf.fit_transform(data_orig_train)
#train and save model
rf_transf_rw = model_rf.fit(data_transf_train_rf_rw.features,
                     data_transf_train_rf_rw.labels.ravel())

data_transf_test_rf_rw = RW_rf.transform(data_orig_test)
fair_rf_rw = get_fair_metrics_and_plot(filename, data_transf_test_rf_rw, rf_transf_rw, plot=False)

Computing fairness of the model.

metric_transf_train = BinaryLabelDatasetMetric(data_transf_train_rf_rw, 
                                               unprivileged_groups=unprivileged_groups,
                                               privileged_groups=privileged_groups)
print("Difference in mean outcomes between unprivileged and privileged groups = %f" % metric_transf_train.mean_difference())

Difference in mean outcomes between unprivileged and privileged groups = -0.000000

fair_rf_rw

from aif360.algorithms.preprocessing import DisparateImpactRemover

DIR_rf = DisparateImpactRemover()
data_transf_train_rf_dir = DIR_rf.fit_transform(data_orig_train)

# Train and save the model
rf_transf_dir = model_rf.fit(data_transf_train_rf_dir.features,data_transf_train_rf_dir.labels.ravel())

fair_dir_rf_dir = get_fair_metrics_and_plot(filename,data_orig_test, rf_transf_dir, plot=False)
fair_dir_rf_dir

Computing fairness of the model.

INPROCESSING¶

#!pip install --user --upgrade tensorflow==1.15.0
#2.2.0
#!pip uninstall tensorflow

#!pip install "tensorflow==1.15"
#!pip install --upgrade tensorflow-hub

#%tensorflow_version 1.15
import tensorflow  as tf
#from tensorflow.compat.v1 import variable_scope
print('Using TensorFlow version', tf.__version__)

Using TensorFlow version 1.15.0

#sess = tf.compat.v1.Session()
#import tensorflow as tf

sess = tf.compat.v1.Session()

#import tensorflow as tf
#sess = tf.Session()
tf.compat.v1.reset_default_graph()

from aif360.algorithms.inprocessing.adversarial_debiasing import AdversarialDebiasing
#with tf.variable_scope('debiased_classifier',reuse=tf.AUTO_REUSE):
with tf.compat.v1.Session() as sess:
    with tf.variable_scope('scope1',reuse=tf.AUTO_REUSE) as scope:
        debiased_model_rf_ad = AdversarialDebiasing(privileged_groups = privileged_groups,
                          unprivileged_groups = unprivileged_groups,
                          scope_name=scope,
                          num_epochs=10,
                          debias=True,
                          sess=sess)
#train and save the model
        debiased_model_rf_ad.fit(data_orig_train)
        fair_rf_ad = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_rf_ad, plot=False, model_aif=True)

WARNING:tensorflow:From C:\Users\krish\Anaconda3\lib\site-packages\aif360\algorithms\inprocessing\adversarial_debiasing.py:89: calling dropout (from tensorflow.python.ops.nn_ops) with keep_prob is deprecated and will be removed in a future version.
Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.
WARNING:tensorflow:From C:\Users\krish\Anaconda3\lib\site-packages\tensorflow_core\python\ops\nn_impl.py:183: where (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
epoch 0; iter: 0; batch classifier loss: 0.823524; batch adversarial loss: 0.732953
epoch 1; iter: 0; batch classifier loss: 0.716969; batch adversarial loss: 0.723881
epoch 2; iter: 0; batch classifier loss: 0.855076; batch adversarial loss: 0.739134
epoch 3; iter: 0; batch classifier loss: 0.757367; batch adversarial loss: 0.719561
epoch 4; iter: 0; batch classifier loss: 0.686314; batch adversarial loss: 0.722460
epoch 5; iter: 0; batch classifier loss: 0.646053; batch adversarial loss: 0.724609
epoch 6; iter: 0; batch classifier loss: 0.618586; batch adversarial loss: 0.722826
epoch 7; iter: 0; batch classifier loss: 0.670463; batch adversarial loss: 0.719570
epoch 8; iter: 0; batch classifier loss: 0.597921; batch adversarial loss: 0.713389
epoch 9; iter: 0; batch classifier loss: 0.589259; batch adversarial loss: 0.713714

<aif360.algorithms.inprocessing.adversarial_debiasing.AdversarialDebiasing at 0x2551ec9a308>

Computing fairness of the model.

fair_rf_ad

from aif360.algorithms.inprocessing import PrejudiceRemover
debiased_model_pr_rf = PrejudiceRemover()

# Train and save the model
debiased_model_pr_rf.fit(data_orig_train)

fair_rf_pr = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_pr_rf, plot=False, model_aif=True)
fair_rf_pr

<aif360.algorithms.inprocessing.prejudice_remover.PrejudiceRemover at 0x2551dc7a188>

Computing fairness of the model.

#¶

y_pred = debiased_model_pr_rf.predict(data_orig_test)


data_orig_test_pred = data_orig_test.copy(deepcopy=True)

# Prediction with the original RandomForest model
scores = np.zeros_like(data_orig_test.labels)
scores = mdl_rf.predict_proba(data_orig_test.features)[:,1].reshape(-1,1)
data_orig_test_pred.scores = scores

preds = np.zeros_like(data_orig_test.labels)
preds = mdl_rf.predict(data_orig_test.features).reshape(-1,1)
data_orig_test_pred.labels = preds

def format_probs(probs1):
    probs1 = np.array(probs1)
    probs0 = np.array(1-probs1)
    return np.concatenate((probs0, probs1), axis=1)

POST PROCESSING¶

from aif360.algorithms.postprocessing import EqOddsPostprocessing
EOPP_rf = EqOddsPostprocessing(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups,
                             seed=40)
EOPP_rf = EOPP_rf.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_rf_eopp = EOPP_rf.predict(data_orig_test_pred)
fair_rf_eo = fair_metrics(filename, data_orig_test, data_transf_test_pred_rf_eopp, pred_is_dataset=True)

Computing fairness of the model.

fair_rf_eo

from aif360.algorithms.postprocessing import CalibratedEqOddsPostprocessing
cost_constraint = "fnr"
CPP_rf = CalibratedEqOddsPostprocessing(privileged_groups = privileged_groups,
                                     unprivileged_groups = unprivileged_groups,
                                     cost_constraint=cost_constraint,
                                     seed=42)

CPP_rf = CPP_rf.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_rf_cpp = CPP_rf.predict(data_orig_test_pred)
fair_rf_ceo = fair_metrics(filename, data_orig_test, data_transf_test_pred_rf_cpp, pred_is_dataset=True)

Computing fairness of the model.

fair_rf_ceo

from aif360.algorithms.postprocessing import RejectOptionClassification
ROC_rf = RejectOptionClassification(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups)

ROC_rf = ROC_rf.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_rf_roc = ROC_rf.predict(data_orig_test_pred)
fair_rf_roc = fair_metrics(filename, data_orig_test, data_transf_test_pred_rf_roc, pred_is_dataset=True)
print('SUCCESS: completed 1 model.')

Computing fairness of the model.
SUCCESS: completed 1 model.

fair_rf_roc

2. XGBoost Classifier¶

from xgboost import XGBClassifier
estimator = XGBClassifier(seed=40)

parameters = {
    'max_depth': range (2, 10, 2),
    'n_estimators': range(60, 240, 40),
    'learning_rate': [0.1, 0.01, 0.05]
}
grid_search = GridSearchCV(
    estimator=estimator,
    param_grid=parameters,
    scoring = 'recall',
    
    cv = 5,
    verbose=0
)

model_xg=grid_search

mdl_xgb = model_xg.fit(data_orig_train.features, data_orig_train.labels.ravel())

conf_mat_xg = confusion_matrix(data_orig_test.labels.ravel(), model_xg.predict(data_orig_test.features))
conf_mat_xg
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), model_xg.predict(data_orig_test.features)))

array([[ 13,  50],
       [  4, 133]], dtype=int64)

0.73

2.a. Feature importance of model¶

importances_xg = model_xg.best_estimator_.feature_importances_
indices_xg = np.argsort(importances_xg)
features = data_orig_train.feature_names
#https://stackoverflow.com/questions/48377296/get-feature-importance-from-gridsearchcv

importances_xg

array([0.5974188 , 0.10316839, 0.        , 0.13026263, 0.        ,
       0.        , 0.        , 0.03108615, 0.10795941, 0.03010464],
      dtype=float32)

importances_xg[indices_xg]

array([0.        , 0.        , 0.        , 0.        , 0.03010464,
       0.03108615, 0.10316839, 0.10795941, 0.13026263, 0.5974188 ],
      dtype=float32)

features

['CurrentAcc_None',
 'NumMonths',
 'CreditHistory_Delay',
 'CreditHistory_none/paid',
 'Collateral_savings/life_insurance',
 'CurrentAcc_GE200',
 'Purpose_repairs',
 'Purpose_radio/tv',
 'Gender',
 'Age']

plt.figure(figsize=(20,30))
plt.title('Feature Importances')
plt.barh(range(len(indices_xg)), importances_xg[indices_xg], color='b', align='center')
plt.yticks(range(len(indices_xg)), [features[i] for i in indices_xg])
plt.xlabel('Relative Importance')
plt.show()

<Figure size 1440x2160 with 0 Axes>

Text(0.5, 1.0, 'Feature Importances')

<BarContainer object of 10 artists>

([<matplotlib.axis.YTick at 0x2552208a7c8>,
  <matplotlib.axis.YTick at 0x25522097588>,
  <matplotlib.axis.YTick at 0x255220c8108>,
  <matplotlib.axis.YTick at 0x255220f6248>,
  <matplotlib.axis.YTick at 0x255220f65c8>,
  <matplotlib.axis.YTick at 0x255220f6c08>,
  <matplotlib.axis.YTick at 0x255220fc248>,
  <matplotlib.axis.YTick at 0x255220fc608>,
  <matplotlib.axis.YTick at 0x255220fcec8>,
  <matplotlib.axis.YTick at 0x25522101548>],
 [Text(0, 0, 'CreditHistory_Delay'),
  Text(0, 0, 'Collateral_savings/life_insurance'),
  Text(0, 0, 'CurrentAcc_GE200'),
  Text(0, 0, 'Purpose_repairs'),
  Text(0, 0, 'Age'),
  Text(0, 0, 'Purpose_radio/tv'),
  Text(0, 0, 'NumMonths'),
  Text(0, 0, 'Gender'),
  Text(0, 0, 'CreditHistory_none/paid'),
  Text(0, 0, 'CurrentAcc_None')])

Text(0.5, 0, 'Relative Importance')

2.b. Model Explainability/interpretability¶

2.b.1 Using SHAP (SHapley Additive exPlanations)¶

import shap
xg_shap_values_t1 = shap.KernelExplainer(mdl_xgb.predict,data_orig_train.features)

Using 800 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

Test data interpretation¶

xgb_explainer = shap.KernelExplainer(mdl_xgb.predict, data_orig_test.features)
xgb_shap_values = xgb_explainer.shap_values(data_orig_test.features,nsamples=10)
#https://towardsdatascience.com/explain-any-models-with-the-shap-values-use-the-kernelexplainer-79de9464897a

Using 200 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

xgb_shap_values

array([[ 0.        , -0.915     ,  0.        , ...,  0.        ,
         0.        ,  0.        ],
       [-0.15428571, -0.51428571,  0.        , ...,  0.        ,
         0.        ,  0.        ],
       [ 0.        ,  0.085     ,  0.        , ...,  0.        ,
         0.        ,  0.        ],
       ...,
       [ 0.0425    ,  0.0425    ,  0.        , ...,  0.        ,
         0.        ,  0.        ],
       [ 0.        ,  0.085     ,  0.        , ...,  0.        ,
         0.        ,  0.        ],
       [ 0.        , -0.18125   ,  0.        , ...,  0.        ,
         0.        ,  0.        ]])

shap.initjs()
shap.force_plot(xgb_explainer.expected_value,xgb_shap_values[0,:], data_orig_test.features[0],data_orig_test.feature_names,link='logit')
#https://github.com/slundberg/shap
#https://github.com/slundberg/shap/issues/279

shap.initjs()
shap.force_plot(xgb_explainer.expected_value,xgb_shap_values[1,:], data_orig_test.features[1],data_orig_test.feature_names,link='logit')

shap.force_plot(xgb_explainer.expected_value,
                xgb_shap_values, data_orig_test.features[:,:],feature_names = data_orig_test.feature_names)

https://medium.datadriveninvestor.com/improving-the-classification-with-tuning-of-pipelines-and-ensemble-models-and-xai-eb69eb60dbfb

p = shap.summary_plot(xgb_shap_values, data_orig_test.features, feature_names=data_orig_test.feature_names,plot_type="bar") 
display(p)

None

The variables with higher impact are the ones in the top.

shap.plots._waterfall.waterfall_legacy(xgb_explainer.expected_value, xgb_shap_values[0,:],feature_names=data_orig_test.feature_names)

Here credit history none/paid is moving target outcome towards right i.e., 1.

Interpretation of graph: https://shap.readthedocs.io/en/latest/example_notebooks/overviews/An%20introduction%20to%20explainable%20AI%20with%20Shapley%20values.html

f(x)- model output impacted by features; E(f(x))- expected output.

One the fundemental properties of Shapley values is that they always sum up to the difference between the game outcome when all players are present and the game outcome when no players are present. For machine learning models this means that SHAP values of all the input features will always sum up to the difference between baseline (expected) model output and the current model output for the prediction being explained.

shap.plots._waterfall.waterfall_legacy(xgb_explainer.expected_value, xgb_shap_values[1],feature_names=data_orig_test.feature_names)

Here Credit History and Age are moving the target result towards right.

2.b.2 Using ELI5¶

#!pip install eli5
import eli5
from eli5.sklearn import PermutationImportance

https://towardsdatascience.com/explainable-artificial-intelligence-part-3-hands-on-machine-learning-model-interpretation-e8ebe5afc608

perm_xgb = PermutationImportance(mdl_xgb).fit(data_orig_test.features, data_orig_test.labels.ravel())

Feature Importance¶

perm_imp_2=eli5.show_weights(perm_xgb,feature_names = data_orig_test.feature_names)
perm_imp_2
plt.show()

2.c. Measuring fairness ¶

Of Baseline model ¶

import pandas as pd
import csv
import os
import numpy as np
import sys
from aif360.metrics import *
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, roc_curve, auc
plot_model_performance(mdl_xgb, X_test, y_test)

fair_xg = get_fair_metrics_and_plot(filename, data_orig_test, model_xg)
fair_xg

Computing fairness of the model.

PRE PROCESSING¶

### Reweighing
from aif360.algorithms.preprocessing import Reweighing

RW_xg = Reweighing(unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups)

data_transf_train_xg_rw = RW_xg.fit_transform(data_orig_train)

#train and save model
xg_transf_rw = model_xg.fit(data_transf_train_xg_rw.features,
                     data_transf_train_xg_rw.labels.ravel())

data_transf_test_xg_rw = RW_xg.transform(data_orig_test)
fair_xg_rw = get_fair_metrics_and_plot(filename, data_transf_test_xg_rw, xg_transf_rw, plot=False)

Computing fairness of the model.

fair_xg_rw

from aif360.algorithms.preprocessing import DisparateImpactRemover

DIR_xg = DisparateImpactRemover()
data_transf_train_xg_dir = DIR_xg.fit_transform(data_orig_train)

# Train and save the model
xg_transf_dir = model_xg.fit(data_transf_train_xg_dir.features,data_transf_train_xg_dir.labels.ravel())

fair_dir_xg_dir = get_fair_metrics_and_plot(filename,data_orig_test, xg_transf_dir, plot=False)
fair_dir_xg_dir

Computing fairness of the model.

INPROCESSING¶

#!pip install --user --upgrade tensorflow==1.15.0
#2.2.0
#!pip uninstall tensorflow

#!pip install "tensorflow==1.15"
#!pip install --upgrade tensorflow-hub

#%tensorflow_version 1.15
import tensorflow  as tf
#from tensorflow.compat.v1 import variable_scope
print('Using TensorFlow version', tf.__version__)

Using TensorFlow version 1.15.0

#sess = tf.compat.v1.Session()
#import tensorflow as tf

sess = tf.compat.v1.Session()

#import tensorflow as tf
#sess = tf.Session()
tf.compat.v1.reset_default_graph()

from aif360.algorithms.inprocessing.adversarial_debiasing import AdversarialDebiasing
#with tf.variable_scope('debiased_classifier',reuse=tf.AUTO_REUSE):
with tf.compat.v1.Session() as sess:
    with tf.variable_scope('scope1',reuse=tf.AUTO_REUSE) as scope:
        debiased_model_xg_ad = AdversarialDebiasing(privileged_groups = privileged_groups,
                          unprivileged_groups = unprivileged_groups,
                          scope_name=scope,
                          num_epochs=10,
                          debias=True,
                          sess=sess)
#train and save the model
        debiased_model_xg_ad.fit(data_orig_train)
        fair_xg_ad = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_xg_ad, plot=False, model_aif=True)

epoch 0; iter: 0; batch classifier loss: 0.979881; batch adversarial loss: 0.681213
epoch 1; iter: 0; batch classifier loss: 0.924482; batch adversarial loss: 0.710266
epoch 2; iter: 0; batch classifier loss: 0.738003; batch adversarial loss: 0.690696
epoch 3; iter: 0; batch classifier loss: 0.672916; batch adversarial loss: 0.644412
epoch 4; iter: 0; batch classifier loss: 0.780086; batch adversarial loss: 0.720220
epoch 5; iter: 0; batch classifier loss: 0.742021; batch adversarial loss: 0.677548
epoch 6; iter: 0; batch classifier loss: 0.725334; batch adversarial loss: 0.688967
epoch 7; iter: 0; batch classifier loss: 0.799759; batch adversarial loss: 0.674640
epoch 8; iter: 0; batch classifier loss: 0.844561; batch adversarial loss: 0.691688
epoch 9; iter: 0; batch classifier loss: 0.636004; batch adversarial loss: 0.642598

<aif360.algorithms.inprocessing.adversarial_debiasing.AdversarialDebiasing at 0x25522526888>

Computing fairness of the model.

fair_xg_ad

from aif360.algorithms.inprocessing import PrejudiceRemover
debiased_model_pr_xg = PrejudiceRemover()

# Train and save the model
debiased_model_pr_xg.fit(data_orig_train)

fair_xg_pr = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_pr_xg, plot=False, model_aif=True)
fair_xg_pr

<aif360.algorithms.inprocessing.prejudice_remover.PrejudiceRemover at 0x255225203c8>

Computing fairness of the model.

#¶

y_pred = debiased_model_pr_xg.predict(data_orig_test)


data_orig_test_pred = data_orig_test.copy(deepcopy=True)

# Prediction with the original RandomForest model
scores = np.zeros_like(data_orig_test.labels)
scores = mdl_xgb.predict_proba(data_orig_test.features)[:,1].reshape(-1,1)
data_orig_test_pred.scores = scores

preds = np.zeros_like(data_orig_test.labels)
preds = mdl_xgb.predict(data_orig_test.features).reshape(-1,1)
data_orig_test_pred.labels = preds

def format_probs(probs1):
    probs1 = np.array(probs1)
    probs0 = np.array(1-probs1)
    return np.concatenate((probs0, probs1), axis=1)

POST PROCESSING¶

from aif360.algorithms.postprocessing import EqOddsPostprocessing
EOPP_xg = EqOddsPostprocessing(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups,
                             seed=40)
EOPP_xg = EOPP_xg.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_xg_eopp = EOPP_xg.predict(data_orig_test_pred)
fair_xg_eo = fair_metrics(filename, data_orig_test, data_transf_test_pred_xg_eopp, pred_is_dataset=True)

Computing fairness of the model.

fair_xg_eo

from aif360.algorithms.postprocessing import CalibratedEqOddsPostprocessing
cost_constraint = "fnr"
CPP_xg = CalibratedEqOddsPostprocessing(privileged_groups = privileged_groups,
                                     unprivileged_groups = unprivileged_groups,
                                     cost_constraint=cost_constraint,
                                     seed=42)

CPP_xg = CPP_xg.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_xg_cpp = CPP_xg.predict(data_orig_test_pred)
fair_xg_ceo = fair_metrics(filename, data_orig_test, data_transf_test_pred_xg_cpp, pred_is_dataset=True)

Computing fairness of the model.

fair_xg_ceo

from aif360.algorithms.postprocessing import RejectOptionClassification
ROC_xg = RejectOptionClassification(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups)

ROC_xg = ROC_xg.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_xg_roc = ROC_xg.predict(data_orig_test_pred)
fair_xg_roc = fair_metrics(filename, data_orig_test, data_transf_test_pred_xg_roc, pred_is_dataset=True)
print('SUCCESS: completed 1 model.')

Computing fairness of the model.
SUCCESS: completed 1 model.

fair_xg_roc

3. XGBOOST with out hyper-parameter tuning¶

from xgboost import XGBClassifier
model_xgb2 = XGBClassifier(seed=40)

mdl_xgb2 = model_xgb2.fit(data_orig_train.features, data_orig_train.labels.ravel())

conf_mat_xg2 = confusion_matrix(data_orig_test.labels.ravel(), model_xgb2.predict(data_orig_test.features))
conf_mat_xg2
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), model_xgb2.predict(data_orig_test.features)))

array([[ 24,  39],
       [ 27, 110]], dtype=int64)

0.67

3.a. Feature importance of model¶

importances_xg2 = model_xgb2.feature_importances_
indices_xg2 = np.argsort(importances_xg2)
features2 = data_orig_train.feature_names
#https://stackoverflow.com/questions/48377296/get-feature-importance-from-gridsearchcv

importances_xg2

array([0.39215407, 0.0720939 , 0.06759191, 0.06214546, 0.06246556,
       0.08996142, 0.03320486, 0.06720946, 0.07087763, 0.08229572],
      dtype=float32)

importances_xg2[indices_xg2]

array([0.03320486, 0.06214546, 0.06246556, 0.06720946, 0.06759191,
       0.07087763, 0.0720939 , 0.08229572, 0.08996142, 0.39215407],
      dtype=float32)

features2

['CurrentAcc_None',
 'NumMonths',
 'CreditHistory_Delay',
 'CreditHistory_none/paid',
 'Collateral_savings/life_insurance',
 'CurrentAcc_GE200',
 'Purpose_repairs',
 'Purpose_radio/tv',
 'Gender',
 'Age']

plt.figure(figsize=(20,30))
plt.title('Feature Importances')
plt.barh(range(len(indices_xg2)), importances_xg2[indices_xg2], color='b', align='center')
plt.yticks(range(len(indices_xg2)), [features2[i] for i in indices_xg2])
plt.xlabel('Relative Importance')
plt.show()

<Figure size 1440x2160 with 0 Axes>

Text(0.5, 1.0, 'Feature Importances')

<BarContainer object of 10 artists>

([<matplotlib.axis.YTick at 0x255254d07c8>,
  <matplotlib.axis.YTick at 0x255254cbe88>,
  <matplotlib.axis.YTick at 0x255254c9b48>,
  <matplotlib.axis.YTick at 0x25525514108>,
  <matplotlib.axis.YTick at 0x25525514708>,
  <matplotlib.axis.YTick at 0x25525514ec8>,
  <matplotlib.axis.YTick at 0x2552551b388>,
  <matplotlib.axis.YTick at 0x2552551ba48>,
  <matplotlib.axis.YTick at 0x25525520348>,
  <matplotlib.axis.YTick at 0x25525520d08>],
 [Text(0, 0, 'Purpose_repairs'),
  Text(0, 0, 'CreditHistory_none/paid'),
  Text(0, 0, 'Collateral_savings/life_insurance'),
  Text(0, 0, 'Purpose_radio/tv'),
  Text(0, 0, 'CreditHistory_Delay'),
  Text(0, 0, 'Gender'),
  Text(0, 0, 'NumMonths'),
  Text(0, 0, 'Age'),
  Text(0, 0, 'CurrentAcc_GE200'),
  Text(0, 0, 'CurrentAcc_None')])

Text(0.5, 0, 'Relative Importance')

3.b. Model Explainability/interpretability¶

3.b.1 Using SHAP (SHapley Additive exPlanations)¶

import shap
xg_shap_values_t = shap.KernelExplainer(mdl_xgb2.predict,data_orig_train.features)

Using 800 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

Test data interpretation¶

xgb_explainer2 = shap.KernelExplainer(mdl_xgb2.predict, data_orig_test.features)
xgb_shap_values2 = xgb_explainer2.shap_values(data_orig_test.features,nsamples=10)
#https://towardsdatascience.com/explain-any-models-with-the-shap-values-use-the-kernelexplainer-79de9464897a

Using 200 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

xgb_shap_values2

array([[ 0.        , -0.105     ,  0.        , ...,  0.395     ,
        -0.35375   ,  0.47      ],
       [-0.08558824, -0.42911765,  0.        , ...,  0.        ,
         0.        ,  0.        ],
       [ 0.        ,  0.        ,  0.        , ...,  0.17      ,
         0.        ,  0.085     ],
       ...,
       [ 0.1775    ,  0.0775    ,  0.        , ...,  0.        ,
         0.        ,  0.        ],
       [ 0.        ,  0.15125   ,  0.10375   , ...,  0.        ,
         0.        ,  0.        ],
       [ 0.        , -0.15833333,  0.        , ...,  0.        ,
         0.        ,  0.        ]])

shap.initjs()
shap.force_plot(xgb_explainer2.expected_value,xgb_shap_values2[0,:],  data_orig_test.features[0],data_orig_test.feature_names,link='logit')
#https://github.com/slundberg/shap
#https://github.com/slundberg/shap/issues/279

shap.initjs()
shap.force_plot(xgb_explainer2.expected_value,xgb_shap_values2[1,:],  data_orig_test.features[1],data_orig_test.feature_names,link='logit')

data_orig_test.feature_names

['CurrentAcc_None',
 'NumMonths',
 'CreditHistory_Delay',
 'CreditHistory_none/paid',
 'Collateral_savings/life_insurance',
 'CurrentAcc_GE200',
 'Purpose_repairs',
 'Purpose_radio/tv',
 'Gender',
 'Age']

shap.force_plot(xgb_explainer2.expected_value,
                xgb_shap_values2, data_orig_test.features[:,:],feature_names = data_orig_test.feature_names)

https://medium.datadriveninvestor.com/improving-the-classification-with-tuning-of-pipelines-and-ensemble-models-and-xai-eb69eb60dbfb

p = shap.summary_plot(xgb_shap_values2, data_orig_test.features, feature_names=data_orig_test.feature_names,plot_type="bar") 
display(p)

None

The variables with higher impact are at the top.

shap.plots._waterfall.waterfall_legacy(xgb_explainer2.expected_value, xgb_shap_values2[0,:],feature_names=data_orig_test.feature_names)

Interpretation of graph: https://shap.readthedocs.io/en/latest/example_notebooks/overviews/An%20introduction%20to%20explainable%20AI%20with%20Shapley%20values.html

f(x)- model output impacted by features; E(f(x))- expected output.
One the fundemental properties of Shapley values is that they always sum up to the difference between the game outcome when all players are present and the game outcome when no players are present. For machine learning models this means that SHAP values of all the input features will always sum up to the difference between baseline (expected) model output and the current model output for the prediction being explained.

shap.plots._waterfall.waterfall_legacy(xgb_explainer2.expected_value, xgb_shap_values2[1],feature_names=data_orig_test.feature_names)

3.b.2 Using ELI5¶

#!pip install eli5
import eli5
from eli5.sklearn import PermutationImportance

https://towardsdatascience.com/explainable-artificial-intelligence-part-3-hands-on-machine-learning-model-interpretation-e8ebe5afc608

perm_xgb2 = PermutationImportance(mdl_xgb2).fit(data_orig_test.features, data_orig_test.labels.ravel())

Feature Importance¶

perm_imp_3=eli5.show_weights(perm_xgb2,feature_names = data_orig_test.feature_names)
perm_imp_3
plt.show()

Explaining individual predictions¶

from eli5 import show_prediction
show_prediction(mdl_xgb2, data_orig_test.features[1], show_feature_values=True,feature_names = data_orig_test.feature_names)

3.c. Measuring fairness ¶

Of Baseline model ¶

import pandas as pd
import csv
import os
import numpy as np
import sys
from aif360.metrics import *
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, roc_curve, auc
plot_model_performance(mdl_xgb2, X_test, y_test)

fair_xg2 = get_fair_metrics_and_plot(filename, data_orig_test, mdl_xgb2)
fair_xg2

Computing fairness of the model.

PRE PROCESSING¶

### Reweighing
from aif360.algorithms.preprocessing import Reweighing

RW_xg2 = Reweighing(unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups)

data_transf_train_xg2_rw = RW_xg2.fit_transform(data_orig_train)

#train and save model
xg2_transf_rw = model_xgb2.fit(data_transf_train_xg2_rw.features,
                     data_transf_train_xg2_rw.labels.ravel())

data_transf_test_xg2_rw = RW_xg2.transform(data_orig_test)
fair_xg2_rw = get_fair_metrics_and_plot(filename, data_transf_test_xg2_rw, xg2_transf_rw, plot=False)

Computing fairness of the model.

fair_xg2_rw

from aif360.algorithms.preprocessing import DisparateImpactRemover

DIR_xg2 = DisparateImpactRemover()
data_transf_train_xg2_dir = DIR_xg2.fit_transform(data_orig_train)

# Train and save the model
xg2_transf_dir = model_xgb2.fit(data_transf_train_xg2_dir.features,data_transf_train_xg2_dir.labels.ravel())

fair_dir_xg2_dir = get_fair_metrics_and_plot(filename,data_orig_test, xg2_transf_dir, plot=False)
fair_dir_xg2_dir

Computing fairness of the model.

INPROCESSING¶

#!pip install --user --upgrade tensorflow==1.15.0
#2.2.0
#!pip uninstall tensorflow

#!pip install "tensorflow==1.15"
#!pip install --upgrade tensorflow-hub

#%tensorflow_version 1.15
import tensorflow  as tf
#from tensorflow.compat.v1 import variable_scope
print('Using TensorFlow version', tf.__version__)

Using TensorFlow version 1.15.0

#sess = tf.compat.v1.Session()
#import tensorflow as tf

sess = tf.compat.v1.Session()

#import tensorflow as tf
#sess = tf.Session()
tf.compat.v1.reset_default_graph()

from aif360.algorithms.inprocessing.adversarial_debiasing import AdversarialDebiasing
#with tf.variable_scope('debiased_classifier',reuse=tf.AUTO_REUSE):
with tf.compat.v1.Session() as sess:
    with tf.variable_scope('scope1',reuse=tf.AUTO_REUSE) as scope:
        debiased_model_xg2_ad = AdversarialDebiasing(privileged_groups = privileged_groups,
                          unprivileged_groups = unprivileged_groups,
                          scope_name=scope,
                          num_epochs=10,
                          debias=True,
                          sess=sess)
#train and save the model
        debiased_model_xg2_ad.fit(data_orig_train)
        fair_xg2_ad = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_xg2_ad, plot=False, model_aif=True)

epoch 0; iter: 0; batch classifier loss: 0.979881; batch adversarial loss: 0.681213
epoch 1; iter: 0; batch classifier loss: 0.924482; batch adversarial loss: 0.710266
epoch 2; iter: 0; batch classifier loss: 0.738003; batch adversarial loss: 0.690696
epoch 3; iter: 0; batch classifier loss: 0.672916; batch adversarial loss: 0.644412
epoch 4; iter: 0; batch classifier loss: 0.780086; batch adversarial loss: 0.720220
epoch 5; iter: 0; batch classifier loss: 0.742021; batch adversarial loss: 0.677548
epoch 6; iter: 0; batch classifier loss: 0.725334; batch adversarial loss: 0.688967
epoch 7; iter: 0; batch classifier loss: 0.799759; batch adversarial loss: 0.674640
epoch 8; iter: 0; batch classifier loss: 0.844561; batch adversarial loss: 0.691688
epoch 9; iter: 0; batch classifier loss: 0.636004; batch adversarial loss: 0.642598

<aif360.algorithms.inprocessing.adversarial_debiasing.AdversarialDebiasing at 0x25525d50508>

Computing fairness of the model.

fair_xg2_ad

from aif360.algorithms.inprocessing import PrejudiceRemover
debiased_model_pr_xg2 = PrejudiceRemover()

# Train and save the model
debiased_model_pr_xg2.fit(data_orig_train)

fair_xg2_pr = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_pr_xg2, plot=False, model_aif=True)
fair_xg2_pr

<aif360.algorithms.inprocessing.prejudice_remover.PrejudiceRemover at 0x2552609fb48>

Computing fairness of the model.

#¶

y_pred = debiased_model_pr_xg2.predict(data_orig_test)


data_orig_test_pred = data_orig_test.copy(deepcopy=True)

# Prediction with the original RandomForest model
scores = np.zeros_like(data_orig_test.labels)
scores = mdl_xgb2.predict_proba(data_orig_test.features)[:,1].reshape(-1,1)
data_orig_test_pred.scores = scores

preds = np.zeros_like(data_orig_test.labels)
preds = mdl_xgb2.predict(data_orig_test.features).reshape(-1,1)
data_orig_test_pred.labels = preds

def format_probs(probs1):
    probs1 = np.array(probs1)
    probs0 = np.array(1-probs1)
    return np.concatenate((probs0, probs1), axis=1)

POST PROCESSING¶

from aif360.algorithms.postprocessing import EqOddsPostprocessing
EOPP_xg2 = EqOddsPostprocessing(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups,
                             seed=40)
EOPP_xg2 = EOPP_xg2.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_xg2_eopp = EOPP_xg2.predict(data_orig_test_pred)
fair_xg2_eo = fair_metrics(filename, data_orig_test, data_transf_test_pred_xg2_eopp, pred_is_dataset=True)

Computing fairness of the model.

fair_xg2_eo

from aif360.algorithms.postprocessing import CalibratedEqOddsPostprocessing
cost_constraint = "fnr"
CPP_xg2 = CalibratedEqOddsPostprocessing(privileged_groups = privileged_groups,
                                     unprivileged_groups = unprivileged_groups,
                                     cost_constraint=cost_constraint,
                                     seed=42)

CPP_xg2 = CPP_xg2.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_xg2_cpp = CPP_xg2.predict(data_orig_test_pred)
fair_xg2_ceo = fair_metrics(filename, data_orig_test, data_transf_test_pred_xg2_cpp, pred_is_dataset=True)

Computing fairness of the model.

fair_xg2_ceo

from aif360.algorithms.postprocessing import RejectOptionClassification
ROC_xg2 = RejectOptionClassification(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups)

ROC_xg2 = ROC_xg2.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_xg2_roc = ROC_xg2.predict(data_orig_test_pred)
fair_xg2_roc = fair_metrics(filename, data_orig_test, data_transf_test_pred_xg2_roc, pred_is_dataset=True)
print('SUCCESS: completed 1 model.')

Computing fairness of the model.
SUCCESS: completed 1 model.

fair_xg2_roc

4. RANDOM FOREST CLASSIFIER MODEL WITH OUT HYPER-PARAMETER TUNING¶

#Creating the classifier
rf_model2 = RandomForestClassifier(random_state=40)
model_rf2=rf_model2

mdl_rf2 = model_rf2.fit(data_orig_train.features, data_orig_train.labels.ravel())

from sklearn.metrics import confusion_matrix
conf_mat_rf2 = confusion_matrix(data_orig_test.labels.ravel(), model_rf2.predict(data_orig_test.features))
conf_mat_rf2
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), model_rf2.predict(data_orig_test.features)))

array([[ 20,  43],
       [ 22, 115]], dtype=int64)

0.675

unique, counts = np.unique(data_orig_test.labels.ravel(), return_counts=True)
dict(zip(unique, counts))

{0.0: 63, 1.0: 137}

4.a. Model Explainability/interpretability¶

4.a.1 Using SHAP (SHapley Additive exPlanations)¶

import shap
rf_shap_values_t2 = shap.KernelExplainer(mdl_rf2.predict,data_orig_train.features)

Using 800 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

Test data interpretation¶

rf_explainer2 = shap.KernelExplainer(mdl_rf2.predict, data_orig_test.features)
rf_shap_values2 = rf_explainer2.shap_values(data_orig_test.features,nsamples=10)
#https://towardsdatascience.com/explain-any-models-with-the-shap-values-use-the-kernelexplainer-79de9464897a

Using 200 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

rf_shap_values2

array([[ 0.     ,  0.     ,  0.     , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     ,  0.     ,  0.097  , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     ,  0.     ,  0.     , ...,  0.21   ,  0.     ,  0.     ],
       ...,
       [ 0.1575 ,  0.0525 ,  0.     , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     ,  0.125  ,  0.085  , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     , -0.045  , -0.17125, ...,  0.     ,  0.     ,  0.     ]])

rf_explainer2.expected_value
rf_shap_values2

0.7899999999999999

array([[ 0.     ,  0.     ,  0.     , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     ,  0.     ,  0.097  , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     ,  0.     ,  0.     , ...,  0.21   ,  0.     ,  0.     ],
       ...,
       [ 0.1575 ,  0.0525 ,  0.     , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     ,  0.125  ,  0.085  , ...,  0.     ,  0.     ,  0.     ],
       [ 0.     , -0.045  , -0.17125, ...,  0.     ,  0.     ,  0.     ]])

shap.initjs()
shap.force_plot(rf_explainer2.expected_value,rf_shap_values2[0,:],  data_orig_test.features[0],data_orig_test.feature_names,link='logit')
#https://github.com/slundberg/shap
#https://github.com/slundberg/shap/issues/279

shap.initjs()
shap.force_plot(rf_explainer2.expected_value,rf_shap_values2[1,:], data_orig_test.features[1],data_orig_test.feature_names,link='logit')

shap.initjs()
shap.force_plot(rf_explainer2.expected_value,rf_shap_values2[2,:], data_orig_test.features[2],data_orig_test.feature_names,link='logit')

data_orig_test.feature_names

['CurrentAcc_None',
 'NumMonths',
 'CreditHistory_Delay',
 'CreditHistory_none/paid',
 'Collateral_savings/life_insurance',
 'CurrentAcc_GE200',
 'Purpose_repairs',
 'Purpose_radio/tv',
 'Gender',
 'Age']

shap.force_plot(rf_explainer2.expected_value,
                rf_shap_values2, data_orig_test.features[:,:],feature_names = data_orig_test.feature_names)

https://medium.datadriveninvestor.com/improving-the-classification-with-tuning-of-pipelines-and-ensemble-models-and-xai-eb69eb60dbfb

p = shap.summary_plot(rf_shap_values2, data_orig_test.features, feature_names=data_orig_test.feature_names,plot_type="bar") 
display(p)

None

Variables with higher impact are displayed at the top.

shap.plots._waterfall.waterfall_legacy(rf_explainer2.expected_value, rf_shap_values2[0,:],feature_names=data_orig_test.feature_names)

Interpretation of graph: https://shap.readthedocs.io/en/latest/example_notebooks/overviews/An%20introduction%20to%20explainable%20AI%20with%20Shapley%20values.html

f(x)- model output impacted by features; E(f(x))- expected output.

One the fundemental properties of Shapley values is that they always sum up to the difference between the game outcome when all players are present and the game outcome when no players are present. For machine learning models this means that SHAP values of all the input features will always sum up to the difference between baseline (expected) model output and the current model output for the prediction being explained.

shap.plots._waterfall.waterfall_legacy(rf_explainer2.expected_value, rf_shap_values2[1],feature_names=data_orig_test.feature_names)

4.a.2 Using ELI5¶

#!pip install eli5
import eli5
from eli5.sklearn import PermutationImportance

https://towardsdatascience.com/explainable-artificial-intelligence-part-3-hands-on-machine-learning-model-interpretation-e8ebe5afc608

perm_rf2 = PermutationImportance(mdl_rf2).fit(data_orig_test.features, data_orig_test.labels.ravel())

data_orig_test.labels[:10,:].ravel()

array([1., 0., 1., 0., 1., 0., 1., 1., 1., 1.])

Feature Importance¶

perm_imp_11=eli5.show_weights(perm_rf2,feature_names = data_orig_test.feature_names)
perm_imp_11
plt.show()

Explaining individual predictions¶

show_prediction(mdl_rf2, data_orig_test.features[0], show_feature_values=True,feature_names = data_orig_test.feature_names)

from eli5 import show_prediction
show_prediction(mdl_rf2, data_orig_test.features[1], show_feature_values=True,feature_names = data_orig_test.feature_names)

4.b. Measuring fairness ¶

Of Baseline model ¶

import pandas as pd
import csv
import os
import numpy as np
import sys
from aif360.metrics import *
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, roc_curve, auc
plot_model_performance(mdl_rf2, X_test, y_test)

fair = get_fair_metrics_and_plot(filename, data_orig_test, mdl_rf2)
fair

Computing fairness of the model.

type(data_orig_train)

aif360.datasets.binary_label_dataset.BinaryLabelDataset

PRE PROCESSING¶

### Reweighing
from aif360.algorithms.preprocessing import Reweighing

RW_rf2 = Reweighing(unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups)

data_transf_train_rf2_rw = RW_rf2.fit_transform(data_orig_train)

#train and save model
rf2_transf_rw = model_rf2.fit(data_transf_train_rf2_rw.features,
                     data_transf_train_rf2_rw.labels.ravel())

data_transf_test_rf2_rw = RW_rf2.transform(data_orig_test)
fair_rf2_rw = get_fair_metrics_and_plot(filename, data_transf_test_rf2_rw, rf2_transf_rw, plot=False)

Computing fairness of the model.

fair_rf_rw

from aif360.algorithms.preprocessing import DisparateImpactRemover

DIR_rf2 = DisparateImpactRemover()
data_transf_train_rf2_dir = DIR_rf2.fit_transform(data_orig_train)

# Train and save the model
rf2_transf_dir = model_rf2.fit(data_transf_train_rf2_dir.features,data_transf_train_rf2_dir.labels.ravel())

fair_dir_rf2_dir = get_fair_metrics_and_plot(filename,data_orig_test, rf2_transf_dir, plot=False)
fair_dir_rf2_dir

Computing fairness of the model.

conf_mat_rf2_dir = confusion_matrix(data_orig_test.labels.ravel(), rf2_transf_dir.predict(data_orig_test.features))
conf_mat_rf2_dir
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), rf2_transf_dir.predict(data_orig_test.features)))

array([[ 15,  48],
       [ 19, 118]], dtype=int64)

0.665

INPROCESSING¶

#!pip install --user --upgrade tensorflow==1.15.0
#2.2.0
#!pip uninstall tensorflow

#!pip install "tensorflow==1.15"
#!pip install --upgrade tensorflow-hub

#%tensorflow_version 1.15
import tensorflow  as tf
#from tensorflow.compat.v1 import variable_scope
print('Using TensorFlow version', tf.__version__)

Using TensorFlow version 1.15.0

#sess = tf.compat.v1.Session()
#import tensorflow as tf

sess = tf.compat.v1.Session()

#import tensorflow as tf
#sess = tf.Session()
tf.compat.v1.reset_default_graph()

from aif360.algorithms.inprocessing.adversarial_debiasing import AdversarialDebiasing
#with tf.variable_scope('debiased_classifier',reuse=tf.AUTO_REUSE):
with tf.compat.v1.Session() as sess:
    with tf.variable_scope('scope1',reuse=tf.AUTO_REUSE) as scope:
        debiased_model_rf2_ad = AdversarialDebiasing(privileged_groups = privileged_groups,
                          unprivileged_groups = unprivileged_groups,
                          scope_name=scope,
                          num_epochs=10,
                          debias=True,
                          sess=sess)
#train and save the model
        debiased_model_rf2_ad.fit(data_orig_train)
        fair_rf2_ad = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_rf2_ad, plot=False, model_aif=True)

epoch 0; iter: 0; batch classifier loss: 0.979881; batch adversarial loss: 0.681213
epoch 1; iter: 0; batch classifier loss: 0.924482; batch adversarial loss: 0.710266
epoch 2; iter: 0; batch classifier loss: 0.738003; batch adversarial loss: 0.690696
epoch 3; iter: 0; batch classifier loss: 0.672916; batch adversarial loss: 0.644412
epoch 4; iter: 0; batch classifier loss: 0.780086; batch adversarial loss: 0.720220
epoch 5; iter: 0; batch classifier loss: 0.742021; batch adversarial loss: 0.677548
epoch 6; iter: 0; batch classifier loss: 0.725334; batch adversarial loss: 0.688967
epoch 7; iter: 0; batch classifier loss: 0.799759; batch adversarial loss: 0.674640
epoch 8; iter: 0; batch classifier loss: 0.844561; batch adversarial loss: 0.691688
epoch 9; iter: 0; batch classifier loss: 0.636004; batch adversarial loss: 0.642598

<aif360.algorithms.inprocessing.adversarial_debiasing.AdversarialDebiasing at 0x2552a3e9e48>

Computing fairness of the model.

fair_rf2_ad

from aif360.algorithms.inprocessing import PrejudiceRemover
debiased_model_pr_rf2 = PrejudiceRemover()

# Train and save the model
debiased_model_pr_rf2.fit(data_orig_train)

fair_rf2_pr = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_pr_rf2, plot=False, model_aif=True)
fair_rf2_pr

<aif360.algorithms.inprocessing.prejudice_remover.PrejudiceRemover at 0x2552a762bc8>

Computing fairness of the model.

#¶

y_pred = debiased_model_pr_rf2.predict(data_orig_test)


data_orig_test_pred = data_orig_test.copy(deepcopy=True)

# Prediction with the original RandomForest model
scores = np.zeros_like(data_orig_test.labels)
scores = mdl_rf2.predict_proba(data_orig_test.features)[:,1].reshape(-1,1)
data_orig_test_pred.scores = scores

preds = np.zeros_like(data_orig_test.labels)
preds = mdl_rf2.predict(data_orig_test.features).reshape(-1,1)
data_orig_test_pred.labels = preds

def format_probs(probs1):
    probs1 = np.array(probs1)
    probs0 = np.array(1-probs1)
    return np.concatenate((probs0, probs1), axis=1)

POST PROCESSING¶

from aif360.algorithms.postprocessing import EqOddsPostprocessing
EOPP_rf2 = EqOddsPostprocessing(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups,
                             seed=40)
EOPP_rf2 = EOPP_rf2.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_rf2_eopp = EOPP_rf2.predict(data_orig_test_pred)
fair_rf2_eo = fair_metrics(filename, data_orig_test, data_transf_test_pred_rf2_eopp, pred_is_dataset=True)

Computing fairness of the model.

fair_rf2_eo

from aif360.algorithms.postprocessing import CalibratedEqOddsPostprocessing
cost_constraint = "fnr"
CPP_rf2 = CalibratedEqOddsPostprocessing(privileged_groups = privileged_groups,
                                     unprivileged_groups = unprivileged_groups,
                                     cost_constraint=cost_constraint,
                                     seed=42)

CPP_rf2 = CPP_rf2.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_rf2_cpp = CPP_rf2.predict(data_orig_test_pred)
fair_rf2_ceo = fair_metrics(filename, data_orig_test, data_transf_test_pred_rf2_cpp, pred_is_dataset=True)

Computing fairness of the model.

fair_rf2_ceo

from aif360.algorithms.postprocessing import RejectOptionClassification
ROC_rf2 = RejectOptionClassification(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups)

ROC_rf2 = ROC_rf2.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_rf2_roc = ROC_rf2.predict(data_orig_test_pred)
fair_rf2_roc = fair_metrics(filename, data_orig_test, data_transf_test_pred_rf2_roc, pred_is_dataset=True)
print('SUCCESS: completed 1 model.')

Computing fairness of the model.
SUCCESS: completed 1 model.

fair_rf2_roc

5. KNN¶

from sklearn import neighbors
n_neighbors = 15
knn = neighbors.KNeighborsClassifier(n_neighbors, weights='distance')

knn.fit(data_orig_train.features, data_orig_train.labels.ravel())

KNeighborsClassifier(n_neighbors=15, weights='distance')

conf_mat_knn = confusion_matrix(data_orig_test.labels.ravel(), knn.predict(data_orig_test.features))
conf_mat_knn
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), knn.predict(data_orig_test.features)))

array([[ 26,  37],
       [ 30, 107]], dtype=int64)

0.665

5.a. Model Explainability/interpretability¶

5.a.1 Using SHAP (SHapley Additive exPlanations)¶

knn_explainer = shap.KernelExplainer(knn.predict, data_orig_test.features)
knn_shap_values = knn_explainer.shap_values(data_orig_test.features,nsamples=10)

Using 200 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

#shap.dependence_plot(0, knn_shap_values, data_orig_test.features)

# plot the SHAP values for the 0th observation 
shap.force_plot(knn_explainer.expected_value,knn_shap_values[0,:],  data_orig_test.features[0],data_orig_test.feature_names,link='logit')

# plot the SHAP values for the 1st observation 
shap.force_plot(knn_explainer.expected_value,knn_shap_values[1,:],  data_orig_test.features[1],data_orig_test.feature_names,link='logit')

shap.force_plot(knn_explainer.expected_value, knn_shap_values,  data_orig_test.feature_names,link='logit')

shap.summary_plot(knn_shap_values, data_orig_test.features,feature_names=data_orig_test.feature_names, plot_type="violin")

Feature Importance

perm_imp_11=eli5.show_weights(knn,feature_names = data_orig_test.feature_names) perm_imp_11 plt.show()

Explaining individual predictions¶

from eli5 import show_prediction
show_prediction(knn, data_orig_test.features[1], show_feature_values=True,feature_names = data_orig_test.feature_names)

5.b. Measuring fairness ¶

Of Baseline model ¶

import pandas as pd
import csv
import os
import numpy as np
import sys
from aif360.metrics import *
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, roc_curve, auc
plot_model_performance(knn, X_test, y_test)

fair = get_fair_metrics_and_plot(filename, data_orig_test, knn)
fair

Computing fairness of the model.

PRE PROCESSING¶

### Reweighing
from aif360.algorithms.preprocessing import Reweighing

RW_knn = Reweighing(unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups)

data_transf_train_knn = RW_knn.fit_transform(data_orig_train)

# Train and save the model
knn_transf_rw = knn.fit(data_transf_train_knn.features,
                     data_transf_train_knn.labels.ravel())

data_transf_test_knn_rw = RW_knn.transform(data_orig_test)
fair_knn_rw = get_fair_metrics_and_plot(filename, data_transf_test_knn_rw, knn_transf_rw, plot=False)

Computing fairness of the model.

fair_knn_rw

from aif360.algorithms.preprocessing import DisparateImpactRemover

DIR = DisparateImpactRemover()
data_transf_train_knn_dir = DIR.fit_transform(data_orig_train)
# Train and save the model
knn_transf_dir = knn.fit(data_transf_train_knn_dir.features,
                     data_transf_train_knn_dir.labels.ravel())

fair_knn_dir = get_fair_metrics_and_plot(filename, data_orig_test, knn_transf_dir, plot=False)
fair_knn_dir

Computing fairness of the model.

INPROCESSING¶

#!pip install tensorflow
import tensorflow  as tf
#from tensorflow.compat.v1 import variable_scope
print('Using TensorFlow version', tf.__version__)

Using TensorFlow version 1.15.0

#sess = tf.compat.v1.Session()
#import tensorflow as tf

sess = tf.compat.v1.Session()

#import tensorflow as tf
#sess = tf.Session()
tf.compat.v1.reset_default_graph()

from aif360.algorithms.inprocessing.adversarial_debiasing import AdversarialDebiasing
#with tf.variable_scope('debiased_classifier',reuse=tf.AUTO_REUSE):
with tf.compat.v1.Session() as sess:
    with tf.variable_scope('scope4',reuse=tf.AUTO_REUSE) as scope:
        debiased_model_knn_ad = AdversarialDebiasing(privileged_groups = privileged_groups,
                          unprivileged_groups = unprivileged_groups,
                          scope_name=scope,
                          num_epochs=10,
                          debias=True,
                          sess=sess)
        debiased_model_knn_ad.fit(data_orig_train)
        fair_knn_ad = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_knn_ad, plot=False, model_aif=True)

epoch 0; iter: 0; batch classifier loss: 0.876255; batch adversarial loss: 0.720002
epoch 1; iter: 0; batch classifier loss: 0.856246; batch adversarial loss: 0.847130
epoch 2; iter: 0; batch classifier loss: 0.709311; batch adversarial loss: 0.884368
epoch 3; iter: 0; batch classifier loss: 0.647673; batch adversarial loss: 0.944726
epoch 4; iter: 0; batch classifier loss: 0.663243; batch adversarial loss: 1.008083
epoch 5; iter: 0; batch classifier loss: 0.807228; batch adversarial loss: 0.984833
epoch 6; iter: 0; batch classifier loss: 0.859303; batch adversarial loss: 0.905210
epoch 7; iter: 0; batch classifier loss: 0.826720; batch adversarial loss: 0.956221
epoch 8; iter: 0; batch classifier loss: 0.802898; batch adversarial loss: 0.910227
epoch 9; iter: 0; batch classifier loss: 0.815773; batch adversarial loss: 0.909956

<aif360.algorithms.inprocessing.adversarial_debiasing.AdversarialDebiasing at 0x2552c9d96c8>

Computing fairness of the model.

fair_knn_ad

from aif360.algorithms.inprocessing import PrejudiceRemover
debiased_model_knn_pr = PrejudiceRemover()

# Train and save the model
debiased_model_knn_pr.fit(data_orig_train)

fair_knn_pr = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_knn_pr, plot=False, model_aif=True)
fair_knn_pr

<aif360.algorithms.inprocessing.prejudice_remover.PrejudiceRemover at 0x2552c95a488>

Computing fairness of the model.

#¶

y_pred = debiased_model_knn_pr.predict(data_orig_test)

data_orig_test_pred = data_orig_test.copy(deepcopy=True)

# Prediction with the original RandomForest model
scores = np.zeros_like(data_orig_test.labels)
scores = knn.predict_proba(data_orig_test.features)[:,1].reshape(-1,1)
data_orig_test_pred.scores = scores

preds = np.zeros_like(data_orig_test.labels)
preds = knn.predict(data_orig_test.features).reshape(-1,1)
data_orig_test_pred.labels = preds

def format_probs(probs1):
    probs1 = np.array(probs1)
    probs0 = np.array(1-probs1)
    return np.concatenate((probs0, probs1), axis=1)

POST PROCESSING¶

from aif360.algorithms.postprocessing import EqOddsPostprocessing
EOPP_knn = EqOddsPostprocessing(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups,
                             seed=40)
EOPP_knn = EOPP_knn.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_knn_eop = EOPP_knn.predict(data_orig_test_pred)
fair_knn_eo = fair_metrics(filename, data_orig_test, data_transf_test_pred_knn_eop, pred_is_dataset=True)

Computing fairness of the model.

fair_knn_eo

from aif360.algorithms.postprocessing import CalibratedEqOddsPostprocessing
cost_constraint = "fnr"
CPP_knn = CalibratedEqOddsPostprocessing(privileged_groups = privileged_groups,
                                     unprivileged_groups = unprivileged_groups,
                                     cost_constraint=cost_constraint,
                                     seed=40)

CPP_knn = CPP_knn.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_knn_cp = CPP_knn.predict(data_orig_test_pred)
fair_knn_ceo = fair_metrics(filename, data_orig_test, data_transf_test_pred_knn_cp, pred_is_dataset=True)

Computing fairness of the model.

fair_knn_ceo

from aif360.algorithms.postprocessing import RejectOptionClassification
ROC_knn = RejectOptionClassification(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups)

ROC_knn = ROC_knn.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_knn_roc = ROC_knn.predict(data_orig_test_pred) 
fair_knn_roc = fair_metrics(filename, data_orig_test, data_transf_test_pred_knn_roc, pred_is_dataset=True)
print('SUCCESS: completed 1 model.')

Computing fairness of the model.
SUCCESS: completed 1 model.

fair_knn_roc

6. Logistic Regression¶

from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()

lr.fit(data_orig_train.features, data_orig_train.labels.ravel())

LogisticRegression()

conf_mat_lr = confusion_matrix(data_orig_test.labels.ravel(), lr.predict(data_orig_test.features))
conf_mat_lr
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), lr.predict(data_orig_test.features)))

array([[ 19,  44],
       [ 12, 125]], dtype=int64)

0.72

6.a. Model Explainability/interpretability¶

6.a.1 Using SHAP (SHapley Additive exPlanations)¶

lr_explainer = shap.KernelExplainer(lr.predict, data_orig_test.features)
lr_shap_values = lr_explainer.shap_values(data_orig_test.features,nsamples=10)

Using 200 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

# plot the SHAP values for the 0th observation 
shap.force_plot(lr_explainer.expected_value,lr_shap_values[0,:],  data_orig_test.features[0],data_orig_test.feature_names,link='logit')

# plot the SHAP values for the 1st observation 
shap.force_plot(lr_explainer.expected_value,lr_shap_values[1,:],  data_orig_test.features[1],data_orig_test.feature_names,link='logit')

shap.force_plot(lr_explainer.expected_value, lr_shap_values,  data_orig_test.feature_names,link='logit')

shap.summary_plot(lr_shap_values, data_orig_test.features,feature_names=data_orig_test.feature_names, plot_type="violin")

Feature Importance

perm_imp_11=eli5.show_weights(knn,feature_names = data_orig_test.feature_names) perm_imp_11 plt.show()

Explaining individual predictions¶

from eli5 import show_prediction
show_prediction(lr, data_orig_test.features[1], show_feature_values=True,feature_names = data_orig_test.feature_names)

6.b. Measuring fairness ¶

Of Baseline model ¶

import pandas as pd
import csv
import os
import numpy as np
import sys
from aif360.metrics import *
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, roc_curve, auc
plot_model_performance(lr, X_test, y_test)

fair_lr = get_fair_metrics_and_plot(filename, data_orig_test, lr)
fair_lr

Computing fairness of the model.

PRE PROCESSING¶

### Reweighing
from aif360.algorithms.preprocessing import Reweighing

RW_lr = Reweighing(unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups)

data_transf_train_lr = RW_lr.fit_transform(data_orig_train)

# Train and save the model
lr_transf_rw = lr.fit(data_transf_train_knn.features,
                     data_transf_train_knn.labels.ravel())

data_transf_test_lr_rw = RW_lr.transform(data_orig_test)
fair_lr_rw = get_fair_metrics_and_plot(filename, data_transf_test_lr_rw, lr_transf_rw, plot=False)

Computing fairness of the model.

fair_lr_rw

from aif360.algorithms.preprocessing import DisparateImpactRemover

DIR = DisparateImpactRemover()
data_transf_train_lr_dir = DIR.fit_transform(data_orig_train)
# Train and save the model
lr_transf_dir = lr.fit(data_transf_train_lr_dir.features,
                     data_transf_train_lr_dir.labels.ravel())

fair_lr_dir = get_fair_metrics_and_plot(filename, data_orig_test, lr_transf_dir, plot=False)
fair_lr_dir

Computing fairness of the model.

INPROCESSING¶

#!pip install tensorflow
import tensorflow  as tf
#from tensorflow.compat.v1 import variable_scope
print('Using TensorFlow version', tf.__version__)

Using TensorFlow version 1.15.0

#sess = tf.compat.v1.Session()
#import tensorflow as tf

sess = tf.compat.v1.Session()

#import tensorflow as tf
#sess = tf.Session()
tf.compat.v1.reset_default_graph()

from aif360.algorithms.inprocessing.adversarial_debiasing import AdversarialDebiasing
#with tf.variable_scope('debiased_classifier',reuse=tf.AUTO_REUSE):
with tf.compat.v1.Session() as sess:
    with tf.variable_scope('scope5',reuse=tf.AUTO_REUSE) as scope:
        debiased_model_lr_ad = AdversarialDebiasing(privileged_groups = privileged_groups,
                          unprivileged_groups = unprivileged_groups,
                          scope_name=scope,
                          num_epochs=10,
                          debias=True,
                          sess=sess)
        debiased_model_lr_ad.fit(data_orig_train)
        fair_lr_ad = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_lr_ad, plot=False, model_aif=True)

epoch 0; iter: 0; batch classifier loss: 0.736848; batch adversarial loss: 0.630137
epoch 1; iter: 0; batch classifier loss: 0.783892; batch adversarial loss: 0.717277
epoch 2; iter: 0; batch classifier loss: 0.752375; batch adversarial loss: 0.609749
epoch 3; iter: 0; batch classifier loss: 0.718494; batch adversarial loss: 0.586989
epoch 4; iter: 0; batch classifier loss: 0.688502; batch adversarial loss: 0.665726
epoch 5; iter: 0; batch classifier loss: 0.661678; batch adversarial loss: 0.605836
epoch 6; iter: 0; batch classifier loss: 0.631300; batch adversarial loss: 0.594107
epoch 7; iter: 0; batch classifier loss: 0.599903; batch adversarial loss: 0.607220
epoch 8; iter: 0; batch classifier loss: 0.656513; batch adversarial loss: 0.699276
epoch 9; iter: 0; batch classifier loss: 0.607014; batch adversarial loss: 0.578153

<aif360.algorithms.inprocessing.adversarial_debiasing.AdversarialDebiasing at 0x2552c86e108>

Computing fairness of the model.

fair_lr_ad

from aif360.algorithms.inprocessing import PrejudiceRemover
debiased_model_lr_pr = PrejudiceRemover()

# Train and save the model
debiased_model_lr_pr.fit(data_orig_train)

fair_lr_pr = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_lr_pr, plot=False, model_aif=True)
fair_lr_pr

<aif360.algorithms.inprocessing.prejudice_remover.PrejudiceRemover at 0x2552c75c188>

Computing fairness of the model.

#¶

y_pred = debiased_model_lr_pr.predict(data_orig_test)

data_orig_test_pred = data_orig_test.copy(deepcopy=True)

# Prediction with the original RandomForest model
scores = np.zeros_like(data_orig_test.labels)
scores = lr.predict_proba(data_orig_test.features)[:,1].reshape(-1,1)
data_orig_test_pred.scores = scores

preds = np.zeros_like(data_orig_test.labels)
preds = lr.predict(data_orig_test.features).reshape(-1,1)
data_orig_test_pred.labels = preds

def format_probs(probs1):
    probs1 = np.array(probs1)
    probs0 = np.array(1-probs1)
    return np.concatenate((probs0, probs1), axis=1)

POST PROCESSING¶

from aif360.algorithms.postprocessing import EqOddsPostprocessing
EOPP_lr = EqOddsPostprocessing(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups,
                             seed=40)
EOPP_lr = EOPP_lr.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_lr_eop = EOPP_lr.predict(data_orig_test_pred)
fair_lr_eo = fair_metrics(filename, data_orig_test, data_transf_test_pred_lr_eop, pred_is_dataset=True)

Computing fairness of the model.

fair_lr_eo

from aif360.algorithms.postprocessing import CalibratedEqOddsPostprocessing
cost_constraint = "fnr"
CPP_lr = CalibratedEqOddsPostprocessing(privileged_groups = privileged_groups,
                                     unprivileged_groups = unprivileged_groups,
                                     cost_constraint=cost_constraint,
                                     seed=40)

CPP_lr = CPP_lr.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_lr_cp = CPP_lr.predict(data_orig_test_pred)
fair_lr_ceo = fair_metrics(filename, data_orig_test, data_transf_test_pred_lr_cp, pred_is_dataset=True)

Computing fairness of the model.

fair_lr_ceo

from aif360.algorithms.postprocessing import RejectOptionClassification
ROC_lr = RejectOptionClassification(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups)

ROC_lr = ROC_lr.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_lr_roc = ROC_lr.predict(data_orig_test_pred) 
fair_lr_roc = fair_metrics(filename, data_orig_test, data_transf_test_pred_lr_roc, pred_is_dataset=True)
print('SUCCESS: completed 1 model.')

Computing fairness of the model.
SUCCESS: completed 1 model.

fair_lr_roc

7. SVM¶

from sklearn.svm import SVC
#gs = grid_search_cv.best_estimator_
svm = SVC(C=0.85, break_ties=False, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovr', degree=3, gamma='scale', kernel='linear',
    max_iter=-1, random_state=42, shrinking=True, tol=0.001, probability=True,
    verbose=False)
svm.fit(data_orig_train.features, data_orig_train.labels.ravel())

SVC(C=0.85, kernel='linear', probability=True, random_state=42)

conf_mat_svm = confusion_matrix(data_orig_test.labels.ravel(), svm.predict(data_orig_test.features))
conf_mat_svm
from sklearn.metrics import accuracy_score
print(accuracy_score(data_orig_test.labels.ravel(), svm.predict(data_orig_test.features)))

array([[ 14,  49],
       [  6, 131]], dtype=int64)

0.725

7.a. Model Explainability/interpretability¶

7.a.1 Using SHAP (SHapley Additive exPlanations)¶

svm_explainer = shap.KernelExplainer(svm.predict, data_orig_test.features)
svm_shap_values = svm_explainer.shap_values(data_orig_test.features,nsamples=10)

Using 200 background data samples could cause slower run times. Consider using shap.sample(data, K) or shap.kmeans(data, K) to summarize the background as K samples.

# plot the SHAP values for the 0th observation 
shap.force_plot(svm_explainer.expected_value,svm_shap_values[0,:],  data_orig_test.features[0],data_orig_test.feature_names,link='logit')

# plot the SHAP values for the 1st observation 
shap.force_plot(svm_explainer.expected_value,svm_shap_values[1,:],  data_orig_test.features[1],data_orig_test.feature_names,link='logit')

shap.force_plot(svm_explainer.expected_value, svm_shap_values,  data_orig_test.feature_names,link='logit')

shap.summary_plot(svm_shap_values, data_orig_test.features,feature_names=data_orig_test.feature_names, plot_type="violin")

Feature Importance

perm_imp_11=eli5.show_weights(knn,feature_names = data_orig_test.feature_names) perm_imp_11 plt.show()

Explaining individual predictions¶

from eli5 import show_prediction
show_prediction(svm, data_orig_test.features[1], show_feature_values=True,feature_names = data_orig_test.feature_names)

7.b. Measuring fairness ¶

Of Baseline model ¶

import pandas as pd
import csv
import os
import numpy as np
import sys
from aif360.metrics import *
from sklearn.metrics import confusion_matrix, accuracy_score, f1_score, roc_curve, auc
plot_model_performance(svm, X_test, y_test)

fair_svm = get_fair_metrics_and_plot(filename, data_orig_test, svm)
fair_svm

Computing fairness of the model.

PRE PROCESSING¶

### Reweighing
from aif360.algorithms.preprocessing import Reweighing

RW_svm = Reweighing(unprivileged_groups=unprivileged_groups, privileged_groups=privileged_groups)

data_transf_train_svm = RW_svm.fit_transform(data_orig_train)

# Train and save the model
svm_transf_rw = svm.fit(data_transf_train_knn.features,
                     data_transf_train_knn.labels.ravel())

data_transf_test_svm_rw = RW_svm.transform(data_orig_test)
fair_svm_rw = get_fair_metrics_and_plot(filename, data_transf_test_svm_rw, svm_transf_rw, plot=False)

Computing fairness of the model.

fair_svm_rw

from aif360.algorithms.preprocessing import DisparateImpactRemover

DIR = DisparateImpactRemover()
data_transf_train_svm_dir = DIR.fit_transform(data_orig_train)
# Train and save the model
svm_transf_dir = svm.fit(data_transf_train_svm_dir.features,
                     data_transf_train_svm_dir.labels.ravel())

fair_svm_dir = get_fair_metrics_and_plot(filename, data_orig_test, svm_transf_dir, plot=False)
fair_svm_dir

Computing fairness of the model.

INPROCESSING¶

#!pip install tensorflow
import tensorflow  as tf
#from tensorflow.compat.v1 import variable_scope
print('Using TensorFlow version', tf.__version__)

Using TensorFlow version 1.15.0

#sess = tf.compat.v1.Session()
#import tensorflow as tf

sess = tf.compat.v1.Session()

#import tensorflow as tf
#sess = tf.Session()
tf.compat.v1.reset_default_graph()

from aif360.algorithms.inprocessing.adversarial_debiasing import AdversarialDebiasing
#with tf.variable_scope('debiased_classifier',reuse=tf.AUTO_REUSE):
with tf.compat.v1.Session() as sess:
    with tf.variable_scope('scope6',reuse=tf.AUTO_REUSE) as scope:
        debiased_model_svm_ad = AdversarialDebiasing(privileged_groups = privileged_groups,
                          unprivileged_groups = unprivileged_groups,
                          scope_name=scope,
                          num_epochs=10,
                          debias=True,
                          sess=sess)
        debiased_model_svm_ad.fit(data_orig_train)
        fair_svm_ad = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_svm_ad, plot=False, model_aif=True)

epoch 0; iter: 0; batch classifier loss: 0.736848; batch adversarial loss: 0.630137
epoch 1; iter: 0; batch classifier loss: 0.783892; batch adversarial loss: 0.717277
epoch 2; iter: 0; batch classifier loss: 0.752375; batch adversarial loss: 0.609749
epoch 3; iter: 0; batch classifier loss: 0.718494; batch adversarial loss: 0.586989
epoch 4; iter: 0; batch classifier loss: 0.688502; batch adversarial loss: 0.665726
epoch 5; iter: 0; batch classifier loss: 0.661678; batch adversarial loss: 0.605836
epoch 6; iter: 0; batch classifier loss: 0.631300; batch adversarial loss: 0.594107
epoch 7; iter: 0; batch classifier loss: 0.599903; batch adversarial loss: 0.607220
epoch 8; iter: 0; batch classifier loss: 0.656513; batch adversarial loss: 0.699276
epoch 9; iter: 0; batch classifier loss: 0.607014; batch adversarial loss: 0.578153

<aif360.algorithms.inprocessing.adversarial_debiasing.AdversarialDebiasing at 0x2553394e888>

Computing fairness of the model.

fair_svm_ad

from aif360.algorithms.inprocessing import PrejudiceRemover
debiased_model_svm_pr = PrejudiceRemover()

# Train and save the model
debiased_model_svm_pr.fit(data_orig_train)

fair_svm_pr = get_fair_metrics_and_plot(filename, data_orig_test, debiased_model_svm_pr, plot=False, model_aif=True)
fair_svm_pr

<aif360.algorithms.inprocessing.prejudice_remover.PrejudiceRemover at 0x25533abdc48>

Computing fairness of the model.

#¶

y_pred = debiased_model_svm_pr.predict(data_orig_test)

data_orig_test_pred = data_orig_test.copy(deepcopy=True)

# Prediction with the original RandomForest model
scores = np.zeros_like(data_orig_test.labels)
scores = svm.predict_proba(data_orig_test.features)[:,1].reshape(-1,1)
data_orig_test_pred.scores = scores

preds = np.zeros_like(data_orig_test.labels)
preds = svm.predict(data_orig_test.features).reshape(-1,1)
data_orig_test_pred.labels = preds

def format_probs(probs1):
    probs1 = np.array(probs1)
    probs0 = np.array(1-probs1)
    return np.concatenate((probs0, probs1), axis=1)

POST PROCESSING¶

from aif360.algorithms.postprocessing import EqOddsPostprocessing
EOPP_svm = EqOddsPostprocessing(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups,
                             seed=40)
EOPP_svm = EOPP_svm.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_svm_eop = EOPP_svm.predict(data_orig_test_pred)
fair_svm_eo = fair_metrics(filename, data_orig_test, data_transf_test_pred_svm_eop, pred_is_dataset=True)

Computing fairness of the model.

fair_svm_eo

from aif360.algorithms.postprocessing import CalibratedEqOddsPostprocessing
cost_constraint = "fnr"
CPP_svm = CalibratedEqOddsPostprocessing(privileged_groups = privileged_groups,
                                     unprivileged_groups = unprivileged_groups,
                                     cost_constraint=cost_constraint,
                                     seed=40)

CPP_svm = CPP_svm.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_svm_cp = CPP_svm.predict(data_orig_test_pred)
fair_svm_ceo = fair_metrics(filename, data_orig_test, data_transf_test_pred_svm_cp, pred_is_dataset=True)

Computing fairness of the model.

fair_svm_ceo

from aif360.algorithms.postprocessing import RejectOptionClassification
ROC_svm = RejectOptionClassification(privileged_groups = privileged_groups,
                             unprivileged_groups = unprivileged_groups)

ROC_svm = ROC_svm.fit(data_orig_test, data_orig_test_pred)
data_transf_test_pred_svm_roc = ROC_svm.predict(data_orig_test_pred) 
fair_svm_roc = fair_metrics(filename, data_orig_test, data_transf_test_pred_svm_roc, pred_is_dataset=True)
print('SUCCESS: completed 1 model.')

Computing fairness of the model.
SUCCESS: completed 1 model.

fair_svm_roc

Contribution^?	Feature	Value
+0.707	CurrentAcc_None	0.000
+0.274	NumMonths	36.000
+0.212	Purpose_radio/tv	1.000
+0.071	CreditHistory_none/paid	1.000
+0.055	Collateral_savings/life_insurance	0.000
+0.047	CurrentAcc_GE200	0.000
-0.022	Gender	1.000
-0.025	CreditHistory_Delay	0.000
-0.030	Purpose_repairs	0.000
-0.072	Age	1.000
-0.992	<BIAS>	1.000

Contribution^?	Feature	Value
+0.707	<BIAS>	1.000
+0.066	Purpose_radio/tv	1.000
+0.048	Age	1.000
+0.022	Gender	1.000
+0.004	Purpose_repairs	0.000
+0.002	CreditHistory_Delay	0.000
-0.003	CurrentAcc_GE200	0.000
-0.007	Collateral_savings/life_insurance	0.000
-0.030	CreditHistory_none/paid	1.000
-0.134	CurrentAcc_None	0.000
-0.140	NumMonths	36.000

	CurrentAcc_None	NumMonths	CreditHistory_Delay	CreditHistory_none/paid	Collateral_savings/life_insurance	Purpose_radio/tv	Gender	Age	CreditStatus
0	0	6	0	0	0	1	1	1	1
1	0	48	0	1	0	1	0	0	0
2	1	12	0	0	0	0	1	1	1
3	0	42	0	1	1	0	1	1	1
4	0	24	1	0	0	0	1	1	0

	CurrentAcc_None	NumMonths	CreditHistory_Delay	CreditHistory_none/paid	Collateral_savings/life_insurance	Purpose_radio/tv	Gender	Age	CreditStatus
0	0	6	0	0	0	1	1	1	1
1	0	48	0	1	0	1	0	0	0
2	1	12	0	0	0	0	1	1	1
3	0	42	0	1	1	0	1	1	1
4	0	24	1	0	0	0	1	1	0

Weight	Feature
0.0263 ± 0.0198	NumMonths
0.0146 ± 0.0131	Purpose_radio/tv
0.0102 ± 0.0117	Age
0.0073 ± 0.0092	Gender
0.0073 ± 0.0000	CurrentAcc_GE200
0.0029 ± 0.0072	CreditHistory_none/paid
0.0015 ± 0.0058	CurrentAcc_None
0 ± 0.0000	Purpose_repairs
0 ± 0.0000	Collateral_savings/life_insurance
0 ± 0.0000	CreditHistory_Delay

	Accuracy	F1	DI	SPD	EOD	AOD	ERD	CNT	TI
objective	1.0	1.000000	1.000000	0.000000	0.00000	0.000000	0.000000	1.000	0.000000
Gender	0.7	0.819277	0.957562	-0.041857	-0.02439	-0.069118	-0.106545	0.975	0.062379

	Accuracy	F1	DI	SPD	EOD	AOD	ERD	CNT	TI
objective	1.00	1.000000	1.000000	0.000000	0.00000	0.000000	0.000000	1	0.000000
Gender	0.69	0.813253	0.907407	-0.092593	-0.04878	-0.139775	-0.120244	[0.977]	0.067752

	Accuracy	F1	DI	SPD	EOD	AOD	ERD	CNT	TI
objective	1.000	1.00000	1.000000	0.00000	0.000000	0.000000	0.000000	1	0.000000
Gender	0.695	0.81571	0.990089	-0.00964	-0.013974	-0.015448	-0.088026	[0.975]	0.067496

Weight	Feature
0.0380 ± 0.0194	NumMonths
0.0204 ± 0.0312	CurrentAcc_None
0.0044 ± 0.0072	CreditHistory_none/paid
0 ± 0.0000	Age
0 ± 0.0000	Gender
0 ± 0.0000	Purpose_radio/tv
0 ± 0.0000	Purpose_repairs
0 ± 0.0000	CurrentAcc_GE200
0 ± 0.0000	Collateral_savings/life_insurance
0 ± 0.0000	CreditHistory_Delay

Weight	Feature
0.0540 ± 0.0462	CurrentAcc_None
0.0430 ± 0.0427	CreditHistory_none/paid
0.0350 ± 0.0623	NumMonths
0.0130 ± 0.0185	CurrentAcc_GE200
0.0100 ± 0.0261	Purpose_radio/tv
0.0070 ± 0.0224	Age
0.0040 ± 0.0194	Collateral_savings/life_insurance
-0.0020 ± 0.0080	Purpose_repairs
-0.0050 ± 0.0179	CreditHistory_Delay
-0.0100 ± 0.0385	Gender

Weight	Feature
0.0410 ± 0.0471	CurrentAcc_None
0.0270 ± 0.0647	NumMonths
0.0240 ± 0.0232	CurrentAcc_GE200
0.0230 ± 0.0301	CreditHistory_none/paid
0.0180 ± 0.0280	Age
0.0110 ± 0.0371	Purpose_radio/tv
-0.0020 ± 0.0162	Collateral_savings/life_insurance
-0.0040 ± 0.0354	Gender
-0.0040 ± 0.0075	Purpose_repairs
-0.0130 ± 0.0136	CreditHistory_Delay

Contribution^?	Feature	Value
+0.771	<BIAS>	1.000
+0.589	Purpose_radio/tv	1.000
+0.518	Age	1.000
+0.506	Gender	1.000
-0.659	CreditHistory_none/paid	1.000
-1.349	NumMonths	36.000

	CurrentAcc_None	NumMonths	CreditHistory_Delay	CreditHistory_none/paid	Collateral_savings/life_insurance	Purpose_radio/tv	Gender	Age	CreditStatus
0	0	6	0	0	0	1	1	1	1
1	0	48	0	1	0	1	0	0	0
2	1	12	0	0	0	0	1	1	1
3	0	42	0	1	1	0	1	1	1
4	0	24	1	0	0	0	1	1	0

	CurrentAcc_None	NumMonths	CreditHistory_Delay	CreditHistory_none/paid	Collateral_savings/life_insurance	Purpose_radio/tv	Gender	Age	CreditStatus
0	0	6	0	0	0	1	1	1	1
1	0	48	0	1	0	1	0	0	0
2	1	12	0	0	0	0	1	1	1
3	0	42	0	1	1	0	1	1	1
4	0	24	1	0	0	0	1	1	0

Contribution^?	Feature	Value
+0.730	<BIAS>	1.000
+0.462	Age	1.000
+0.462	Gender	1.000
+0.462	Purpose_radio/tv	1.000
-0.346	CreditHistory_none/paid	1.000
-1.385	NumMonths	36.000

	Accuracy	F1	DI	SPD	EOD	AOD	ERD	CNT	TI
objective	1.0	1.0000	1.000000	0.000000	0.000000	0.000000	0.000000	1	0.000000
Gender	0.7	0.8125	0.805359	-0.187976	-0.135925	-0.258732	-0.081177	[0.914]	0.091659

	CurrentAcc_None	NumMonths	CreditHistory_Delay	CreditHistory_none/paid	Collateral_savings/life_insurance	Purpose_radio/tv	Gender	Age	CreditStatus
0	0	6	0	0	0	1	1	1	1
1	0	48	0	1	0	1	0	0	0
2	1	12	0	0	0	0	1	1	1
3	0	42	0	1	1	0	1	1	1
4	0	24	1	0	0	0	1	1	0

	CurrentAcc_None	NumMonths	CreditHistory_Delay	CreditHistory_none/paid	Collateral_savings/life_insurance	Purpose_radio/tv	Gender	Age	CreditStatus
0	0	6	0	0	0	1	1	1	1
1	0	48	0	1	0	1	0	0	0
2	1	12	0	0	0	0	1	1	1
3	0	42	0	1	1	0	1	1	1
4	0	24	1	0	0	0	1	1	0