sklearn_ensemble: ensemble.xml comparison

comparison ensemble.xml @ 6:4c2fae2db5d1 draft

planemo upload for repository https://github.com/bgruening/galaxytools/tools/sklearn commit 641ac64ded23fbb6fe85d5f13926da12dcce4e76

author	bgruening
date	Tue, 13 Mar 2018 04:51:40 -0400
parents	3bc536788043
children	ea8b1c89c20b

comparison

equal deleted inserted replaced

-:1059756bb41b
+:4c2fae2db5d1
 from scipy.io import mmread
 input_json_path = sys.argv[1]
 params = json.load(open(input_json_path, "r"))
+@COLUMNS_FUNCTION@
 #if $selected_tasks.selected_task == "train":
 algorithm = params["selected_tasks"]["selected_algorithms"]["selected_algorithm"]
 options = params["selected_tasks"]["selected_algorithms"]["options"]
 input_type = params["selected_tasks"]["selected_algorithms"]["input_options"]["selected_input"]
 if input_type=="tabular":
-col1 = params["selected_tasks"]["selected_algorithms"]["input_options"]["col1"]
+X = read_columns(
-col1 = list(map(lambda x: x - 1, col1))
+"$selected_tasks.selected_algorithms.input_options.infile1",
-f1 = pandas.read_csv("$selected_tasks.selected_algorithms.input_options.infile1", sep='\t', header=None, index_col=None, parse_dates=True, encoding=None, tupleize_cols=False )
+"$selected_tasks.selected_algorithms.input_options.col1",
-X = f1.iloc[:,col1].values
+sep='\t',
+header=None,
+parse_dates=True
+)
 else:
 X = mmread(open("$selected_tasks.selected_algorithms.input_options.infile1", 'r'))
-col2 = params["selected_tasks"]["selected_algorithms"]["input_options"]["col2"]
+y = read_columns(
-col2 = list(map(lambda x: x - 1, col2))
+"$selected_tasks.selected_algorithms.input_options.infile2",
-f2 = pandas.read_csv("$selected_tasks.selected_algorithms.input_options.infile2", sep='\t', header=None, index_col=None, parse_dates=True, encoding=None, tupleize_cols=False )
+"$selected_tasks.selected_algorithms.input_options.col2",
-y = f2.iloc[:,col2].values
+sep='\t',
+header=None,
+parse_dates=True
+)
 my_class = getattr(sklearn.ensemble, algorithm)
 estimator = my_class(**options)
 estimator.fit(X,y)
 pickle.dump(estimator,open("$outfile_fit", 'w+'), pickle.HIGHEST_PROTOCOL)
 #else:
 classifier_object = pickle.load(open("$selected_tasks.infile_model", 'r'))
-data = pandas.read_csv("$selected_tasks.infile_data", sep='\t', header=0, index_col=None, parse_dates=True, encoding=None, tupleize_cols=False )
+data = pandas.read_csv("$selected_tasks.infile_data", sep='\t', header=0, index_col=None, parse_dates=True, encoding=None, tupleize_cols=False)
 prediction = classifier_object.predict(data)
 prediction_df = pandas.DataFrame(prediction)
 res = pandas.concat([data, prediction_df], axis=1)
 res.to_csv(path_or_buf = "$outfile_predict", sep="\t", index=False)
 #end if

Mercurial > repos > bgruening > sklearn_ensemble

comparison ensemble.xml @ 6:4c2fae2db5d1 draft