matchms: matchms_similarity_wrapper.py comparison

comparison matchms_similarity_wrapper.py @ 11:ba9410f612bc draft

"planemo upload for repository https://github.com/RECETOX/galaxytools/tree/master/tools/matchms commit c32f579c38aef4c2c5d088e6c1c9e522bc0a1a12"

author	recetox
date	Thu, 17 Mar 2022 12:26:24 +0000
parents	c3dd958cc4a5
children	cfa8b66fb106

comparison

equal deleted inserted replaced

-:c3dd958cc4a5
+:ba9410f612bc
 import argparse
 import sys
+import numpy as np
 from matchms import calculate_scores
 from matchms.importing import load_from_mgf, load_from_msp
-from matchms.similarity import (
+from matchms.similarity import CosineGreedy, CosineHungarian, MetadataMatch, ModifiedCosine
-CosineGreedy,
-CosineHungarian,
-ModifiedCosine,
-)
 from pandas import DataFrame
 def convert_precursor_mz(spectrum):
 """
 raise ValueError("Precursor_mz missing. Apply 'add_precursor_mz' filter first.")
 def main(argv):
 parser = argparse.ArgumentParser(description="Compute MSP similarity scores")
+parser.add_argument("-r", dest="ri_tolerance", type=float, help="Use RI filtering with given tolerance.")
 parser.add_argument("-s", dest="symmetric", action='store_true', help="Computation is symmetric.")
 parser.add_argument("--ref", dest="references_filename", type=str, help="Path to reference spectra library.")
 parser.add_argument("--ref_format", dest="references_format", type=str, help="Reference spectra library file format.")
 parser.add_argument("queries_filename", type=str, help="Path to query spectra.")
 parser.add_argument("queries_format", type=str, help="Query spectra file format.")
 queries=queries_spectra,
 similarity_function=similarity_metric,
 is_symmetric=args.symmetric
 )
+if args.ri_tolerance is not None:
+print("RI filtering with tolerance ", args.ri_tolerance)
+ri_matches = calculate_scores(reference_spectra, queries_spectra, MetadataMatch("retention_index", "difference", args.ri_tolerance)).scores
+scores.scores["score"] = np.where(ri_matches, scores.scores["score"], 0.0)
 write_outputs(args, scores)
 return 0
 def write_outputs(args, scores):
 print("Storing outputs...")
-query_names = [spectra.metadata['name'] for spectra in scores.queries]
+query_names = [spectra.metadata['compound_name'] for spectra in scores.queries]
-reference_names = [spectra.metadata['name'] for spectra in scores.references]
+reference_names = [spectra.metadata['compound_name'] for spectra in scores.references]
 # Write scores to dataframe
 dataframe_scores = DataFrame(data=[entry["score"] for entry in scores.scores], index=reference_names, columns=query_names)
 dataframe_scores.to_csv(args.output_filename_scores, sep='\t')

Mercurial > repos > recetox > matchms

comparison matchms_similarity_wrapper.py @ 11:ba9410f612bc draft