sklearn_train_test_split: train_test

comparison train_test_eval.py @ 6:81ab4951f2a3 draft

"planemo upload for repository https://github.com/bgruening/galaxytools/tree/master/tools/sklearn commit ca87db9c038a6fcf96aa39da50f384865fd932ff"

author	bgruening
date	Tue, 20 Apr 2021 17:09:29 +0000
parents	c0ed68e280a7
children	82f89e379413

comparison

equal deleted inserted replaced

-:c0ed68e280a7
+:81ab4951f2a3
 import joblib
 import numpy as np
 import pandas as pd
 from galaxy_ml.model_validations import train_test_split
-from galaxy_ml.utils import (
+from galaxy_ml.utils import (get_module, get_scoring, load_model,
-get_module,
+read_columns, SafeEval, try_get_attr)
-get_scoring,
-load_model,
-read_columns,
-SafeEval,
-try_get_attr,
-)
 from scipy.io import mmread
 from sklearn import pipeline
 from sklearn.metrics.scorer import _check_multimetric_scoring
 from sklearn.model_selection import _search, _validation
 from sklearn.model_selection._validation import _score
 from sklearn.utils import indexable, safe_indexing
 _fit_and_score = try_get_attr("galaxy_ml.model_validations", "_fit_and_score")
 setattr(_search, "_fit_and_score", _fit_and_score)
 setattr(_validation, "_fit_and_score", _fit_and_score)
 infile2 = loaded_df[df_key]
 else:
 infile2 = pd.read_csv(infile2, sep="\t", header=header, parse_dates=True)
 loaded_df[df_key] = infile2
-y = read_columns(infile2,
+y = read_columns(
-c=c,
+infile2, c=c, c_option=column_option, sep="\t", header=header, parse_dates=True
-c_option=column_option,
+)
-sep='\t',
-header=header,
-parse_dates=True)
 if len(y.shape) == 2 and y.shape[1] == 1:
 y = y.ravel()
 if input_type == "refseq_and_interval":
 estimator.set_params(data_batch_generator__features=y.ravel().tolist())
 y = None
 df_key = groups + repr(header)
 if df_key in loaded_df:
 groups = loaded_df[df_key]
-groups = read_columns(groups,
+groups = read_columns(
-c=c,
+groups,
-c_option=column_option,
+c=c,
-sep='\t',
+c_option=column_option,
-header=header,
+sep="\t",
-parse_dates=True)
+header=header,
+parse_dates=True,
+)
 groups = groups.ravel()
 # del loaded_df
 del loaded_df
 else:
 raise ValueError(
 "Stratified shuffle split is not " "applicable on empty target values!"
 )
-X_train, X_test, y_train, y_test, groups_train, _groups_test = train_test_split_none(
+(
-X, y, groups, **test_split_options
+X_train,
-)
+X_test,
+y_train,
+y_test,
+groups_train,
+_groups_test,
+) = train_test_split_none(X, y, groups, **test_split_options)
 exp_scheme = params["experiment_schemes"]["selected_exp_scheme"]
 # handle validation (second) split
 if exp_scheme == "train_val_test":

Mercurial > repos > bgruening > sklearn_train_test_split

comparison train_test_eval.py @ 6:81ab4951f2a3 draft