stacking_ensemble_models: keras_deep

comparison keras_deep_learning.py @ 3:0a1812986bc3 draft

planemo upload for repository https://github.com/bgruening/galaxytools/tree/master/tools/sklearn commit 9981e25b00de29ed881b2229a173a8c812ded9bb

author	bgruening
date	Wed, 09 Aug 2023 11:10:37 +0000
parents	38c4f8a98038
children

comparison

equal deleted inserted replaced

-:38c4f8a98038
+:0a1812986bc3
 import argparse
 import json
-import keras
+import warnings
-import pandas as pd
+from ast import literal_eval
-import pickle
 import six
-import warnings
+from galaxy_ml.model_persist import dump_model_to_h5
+from galaxy_ml.utils import SafeEval, try_get_attr
-from ast import literal_eval
+from tensorflow import keras
-from keras.models import Sequential, Model
+from tensorflow.keras.models import Model, Sequential
-from galaxy_ml.utils import try_get_attr, get_search_params, SafeEval
 safe_eval = SafeEval()
 def _handle_shape(literal):
 if not l1 and not l2:
 return None
 if l1 is None:
-l1 = 0.
+l1 = 0.0
 if l2 is None:
-l2 = 0.
+l2 = 0.0
 return keras.regularizers.l1_l2(l1=l1, l2=l2)
 def _handle_constraint(config):
 },
 "constraint_type":
 "MinMaxNorm"
 }
 """
-constraint_type = config['constraint_type']
+constraint_type = config["constraint_type"]
-if constraint_type in ('None', ''):
+if constraint_type in ("None", ""):
 return None
 klass = getattr(keras.constraints, constraint_type)
-options = config.get('constraint_options', {})
+options = config.get("constraint_options", {})
-if 'axis' in options:
+if "axis" in options:
-options['axis'] = literal_eval(options['axis'])
+options["axis"] = literal_eval(options["axis"])
 return klass(**options)
 def _handle_lambda(literal):
 return None
 def _handle_layer_parameters(params):
-"""Access to handle all kinds of parameters
+"""Access to handle all kinds of parameters"""
-"""
 for key, value in six.iteritems(params):
-if value in ('None', ''):
+if value in ("None", ""):
 params[key] = None
 continue
-if type(value) in [int, float, bool]\
+if type(value) in [int, float, bool] or (
-or (type(value) is str and value.isalpha()):
+type(value) is str and value.isalpha()
+):
 continue
-if key in ['input_shape', 'noise_shape', 'shape', 'batch_shape',
+if key in [
-'target_shape', 'dims', 'kernel_size', 'strides',
+"input_shape",
-'dilation_rate', 'output_padding', 'cropping', 'size',
+"noise_shape",
-'padding', 'pool_size', 'axis', 'shared_axes'] \
+"shape",
-and isinstance(value, str):
+"batch_shape",
+"target_shape",
+"dims",
+"kernel_size",
+"strides",
+"dilation_rate",
+"output_padding",
+"cropping",
+"size",
+"padding",
+"pool_size",
+"axis",
+"shared_axes",
+] and isinstance(value, str):
 params[key] = _handle_shape(value)
-elif key.endswith('_regularizer') and isinstance(value, dict):
+elif key.endswith("_regularizer") and isinstance(value, dict):
 params[key] = _handle_regularizer(value)
-elif key.endswith('_constraint') and isinstance(value, dict):
+elif key.endswith("_constraint") and isinstance(value, dict):
 params[key] = _handle_constraint(value)
-elif key == 'function':  # No support for lambda/function eval
+elif key == "function":  # No support for lambda/function eval
 params.pop(key)
 return params
 Parameters:
 -----------
 config : dictionary, galaxy tool parameters loaded by JSON
 """
 model = Sequential()
-input_shape = _handle_shape(config['input_shape'])
+input_shape = _handle_shape(config["input_shape"])
-layers = config['layers']
+layers = config["layers"]
 for layer in layers:
-options = layer['layer_selection']
+options = layer["layer_selection"]
-layer_type = options.pop('layer_type')
+layer_type = options.pop("layer_type")
 klass = getattr(keras.layers, layer_type)
-kwargs = options.pop('kwargs', '')
+kwargs = options.pop("kwargs", "")
 # parameters needs special care
 options = _handle_layer_parameters(options)
 if kwargs:
-kwargs = safe_eval('dict(' + kwargs + ')')
+kwargs = safe_eval("dict(" + kwargs + ")")
 options.update(kwargs)
 # add input_shape to the first layer only
-if not getattr(model, '_layers') and input_shape is not None:
+if not model.get_config()["layers"] and input_shape is not None:
-options['input_shape'] = input_shape
+options["input_shape"] = input_shape
 model.add(klass(**options))
 return model
 Parameters
 -----------
 config : dictionary, galaxy tool parameters loaded by JSON
 """
-layers = config['layers']
+layers = config["layers"]
 all_layers = []
 for layer in layers:
-options = layer['layer_selection']
+options = layer["layer_selection"]
-layer_type = options.pop('layer_type')
+layer_type = options.pop("layer_type")
 klass = getattr(keras.layers, layer_type)
-inbound_nodes = options.pop('inbound_nodes', None)
+inbound_nodes = options.pop("inbound_nodes", None)
-kwargs = options.pop('kwargs', '')
+kwargs = options.pop("kwargs", "")
 # parameters needs special care
 options = _handle_layer_parameters(options)
 if kwargs:
-kwargs = safe_eval('dict(' + kwargs + ')')
+kwargs = safe_eval("dict(" + kwargs + ")")
 options.update(kwargs)
 # merge layers
-if 'merging_layers' in options:
+if "merging_layers" in options:
-idxs = literal_eval(options.pop('merging_layers'))
+idxs = literal_eval(options.pop("merging_layers"))
-merging_layers = [all_layers[i-1] for i in idxs]
+merging_layers = [all_layers[i - 1] for i in idxs]
 new_layer = klass(**options)(merging_layers)
 # non-input layers
 elif inbound_nodes is not None:
-new_layer = klass(**options)(all_layers[inbound_nodes-1])
+new_layer = klass(**options)(all_layers[inbound_nodes - 1])
 # input layers
 else:
 new_layer = klass(**options)
 all_layers.append(new_layer)
-input_indexes = _handle_shape(config['input_layers'])
+input_indexes = _handle_shape(config["input_layers"])
-input_layers = [all_layers[i-1] for i in input_indexes]
+input_layers = [all_layers[i - 1] for i in input_indexes]
-output_indexes = _handle_shape(config['output_layers'])
+output_indexes = _handle_shape(config["output_layers"])
-output_layers = [all_layers[i-1] for i in output_indexes]
+output_layers = [all_layers[i - 1] for i in output_indexes]
 return Model(inputs=input_layers, outputs=output_layers)
 def get_batch_generator(config):
 Parameters
 -----------
 config : dictionary, galaxy tool parameters loaded by JSON
 """
-generator_type = config.pop('generator_type')
+generator_type = config.pop("generator_type")
-if generator_type == 'none':
+if generator_type == "none":
 return None
-klass = try_get_attr('galaxy_ml.preprocessors', generator_type)
+klass = try_get_attr("galaxy_ml.preprocessors", generator_type)
-if generator_type == 'GenomicIntervalBatchGenerator':
+if generator_type == "GenomicIntervalBatchGenerator":
-config['ref_genome_path'] = 'to_be_determined'
+config["ref_genome_path"] = "to_be_determined"
-config['intervals_path'] = 'to_be_determined'
+config["intervals_path"] = "to_be_determined"
-config['target_path'] = 'to_be_determined'
+config["target_path"] = "to_be_determined"
-config['features'] = 'to_be_determined'
+config["features"] = "to_be_determined"
 else:
-config['fasta_path'] = 'to_be_determined'
+config["fasta_path"] = "to_be_determined"
 return klass(**config)
 def config_keras_model(inputs, outfile):
-""" config keras model layers and output JSON
+"""config keras model layers and output JSON
 Parameters
 ----------
 inputs : dict
 loaded galaxy tool parameters from `keras_model_config`
 tool.
 outfile : str
 Path to galaxy dataset containing keras model JSON.
 """
-model_type = inputs['model_selection']['model_type']
+model_type = inputs["model_selection"]["model_type"]
-layers_config = inputs['model_selection']
+layers_config = inputs["model_selection"]
-if model_type == 'sequential':
+if model_type == "sequential":
 model = get_sequential_model(layers_config)
 else:
 model = get_functional_model(layers_config)
 json_string = model.to_json()
-with open(outfile, 'w') as f:
+with open(outfile, "w") as f:
 json.dump(json.loads(json_string), f, indent=2)
-def build_keras_model(inputs, outfile, model_json, infile_weights=None,
+def build_keras_model(inputs, outfile, model_json, batch_mode=False):
-batch_mode=False, outfile_params=None):
+"""for `keras_model_builder` tool
-""" for `keras_model_builder` tool
 Parameters
 ----------
 inputs : dict
 loaded galaxy tool parameters from `keras_model_builder` tool.
 outfile : str
 Path to galaxy dataset containing the keras_galaxy model output.
 model_json : str
 Path to dataset containing keras model JSON.
-infile_weights : str or None
-If string, path to dataset containing model weights.
 batch_mode : bool, default=False
 Whether to build online batch classifier.
-outfile_params : str, default=None
+"""
-File path to search parameters output.
+with open(model_json, "r") as f:
-"""
-with open(model_json, 'r') as f:
 json_model = json.load(f)
-config = json_model['config']
+config = json_model["config"]
 options = {}
-if json_model['class_name'] == 'Sequential':
+if json_model["class_name"] == "Sequential":
-options['model_type'] = 'sequential'
+options["model_type"] = "sequential"
 klass = Sequential
-elif json_model['class_name'] == 'Model':
+elif json_model["class_name"] == "Functional":
-options['model_type'] = 'functional'
+options["model_type"] = "functional"
 klass = Model
 else:
-raise ValueError("Unknow Keras model class: %s"
+raise ValueError("Unknow Keras model class: %s" % json_model["class_name"])
-% json_model['class_name'])
 # load prefitted model
-if inputs['mode_selection']['mode_type'] == 'prefitted':
+if inputs["mode_selection"]["mode_type"] == "prefitted":
-estimator = klass.from_config(config)
+# estimator = klass.from_config(config)
-estimator.load_weights(infile_weights)
+# estimator.load_weights(infile_weights)
+raise Exception("Prefitted was deprecated!")
 # build train model
 else:
-cls_name = inputs['mode_selection']['learning_type']
+cls_name = inputs["mode_selection"]["learning_type"]
-klass = try_get_attr('galaxy_ml.keras_galaxy_models', cls_name)
+klass = try_get_attr("galaxy_ml.keras_galaxy_models", cls_name)
-options['loss'] = (inputs['mode_selection']
+options["loss"] = inputs["mode_selection"]["compile_params"]["loss"]
-['compile_params']['loss'])
+options["optimizer"] = (
-options['optimizer'] =\
+inputs["mode_selection"]["compile_params"]["optimizer_selection"][
-(inputs['mode_selection']['compile_params']
+"optimizer_type"
-['optimizer_selection']['optimizer_type']).lower()
+]
+).lower()
-options.update((inputs['mode_selection']['compile_params']
-['optimizer_selection']['optimizer_options']))
+options.update(
+(
-train_metrics = (inputs['mode_selection']['compile_params']
+inputs["mode_selection"]["compile_params"]["optimizer_selection"][
-['metrics']).split(',')
+"optimizer_options"
-if train_metrics[-1] == 'none':
+]
-train_metrics = train_metrics[:-1]
+)
-options['metrics'] = train_metrics
+)
-options.update(inputs['mode_selection']['fit_params'])
+train_metrics = inputs["mode_selection"]["compile_params"]["metrics"]
-options['seed'] = inputs['mode_selection']['random_seed']
+if not isinstance(train_metrics, list):  # for older galaxy
+train_metrics = train_metrics.split(",")
+if train_metrics[-1] == "none":
+train_metrics.pop()
+options["metrics"] = train_metrics
+options.update(inputs["mode_selection"]["fit_params"])
+options["seed"] = inputs["mode_selection"]["random_seed"]
 if batch_mode:
-generator = get_batch_generator(inputs['mode_selection']
+generator = get_batch_generator(
-['generator_selection'])
+inputs["mode_selection"]["generator_selection"]
-options['data_batch_generator'] = generator
+)
-options['prediction_steps'] = \
+options["data_batch_generator"] = generator
-inputs['mode_selection']['prediction_steps']
+options["prediction_steps"] = inputs["mode_selection"]["prediction_steps"]
-options['class_positive_factor'] = \
+options["class_positive_factor"] = inputs["mode_selection"][
-inputs['mode_selection']['class_positive_factor']
+"class_positive_factor"
+]
 estimator = klass(config, **options)
-if outfile_params:
-hyper_params = get_search_params(estimator)
-# TODO: remove this after making `verbose` tunable
-for h_param in hyper_params:
-if h_param[1].endswith('verbose'):
-h_param[0] = '@'
-df = pd.DataFrame(hyper_params, columns=['', 'Parameter', 'Value'])
-df.to_csv(outfile_params, sep='\t', index=False)
 print(repr(estimator))
-# save model by pickle
+# save model
-with open(outfile, 'wb') as f:
+dump_model_to_h5(estimator, outfile, verbose=1)
-pickle.dump(estimator, f, pickle.HIGHEST_PROTOCOL)
+if __name__ == "__main__":
-if __name__ == '__main__':
+warnings.simplefilter("ignore")
-warnings.simplefilter('ignore')
 aparser = argparse.ArgumentParser()
 aparser.add_argument("-i", "--inputs", dest="inputs", required=True)
 aparser.add_argument("-m", "--model_json", dest="model_json")
 aparser.add_argument("-t", "--tool_id", dest="tool_id")
-aparser.add_argument("-w", "--infile_weights", dest="infile_weights")
 aparser.add_argument("-o", "--outfile", dest="outfile")
-aparser.add_argument("-p", "--outfile_params", dest="outfile_params")
 args = aparser.parse_args()
 input_json_path = args.inputs
-with open(input_json_path, 'r') as param_handler:
+with open(input_json_path, "r") as param_handler:
 inputs = json.load(param_handler)
 tool_id = args.tool_id
 outfile = args.outfile
-outfile_params = args.outfile_params
 model_json = args.model_json
-infile_weights = args.infile_weights
 # for keras_model_config tool
-if tool_id == 'keras_model_config':
+if tool_id == "keras_model_config":
 config_keras_model(inputs, outfile)
 # for keras_model_builder tool
 else:
 batch_mode = False
-if tool_id == 'keras_batch_models':
+if tool_id == "keras_batch_models":
 batch_mode = True
-build_keras_model(inputs=inputs,
+build_keras_model(
-model_json=model_json,
+inputs=inputs, model_json=model_json, batch_mode=batch_mode, outfile=outfile
-infile_weights=infile_weights,
+)
-batch_mode=batch_mode,
-outfile=outfile,
-outfile_params=outfile_params)

Mercurial > repos > bgruening > stacking_ensemble_models

comparison keras_deep_learning.py @ 3:0a1812986bc3 draft