proteore_reactome: reactome_analysis.py comparison

comparison reactome_analysis.py @ 5:34097acf457c draft

planemo upload commit fb27a6b5de5cd7b269a41be3c85c593b77aa1b18-dirty

author	proteore
date	Thu, 27 Jun 2019 04:21:19 -0400
parents	988a6f43acdb
children	eb051cba2bda

comparison

equal deleted inserted replaced

-:113cce3fc379
+:34097acf457c
-import os
+import os, re, json, argparse, csv
-import re
-import json
-import argparse
 CURRENT_DIR = os.path.dirname(os.path.abspath(__file__))
 def id_valid(identifiers):
 """
 Submit IDs list to Reactome and return results in json format
 Return error in HTML format if web service is not available
 """
 trash = []
 if identifiers[1] == "list":
-ids = "\n".join(id_valid(identifiers[0].split())[0])
+ids = identifiers[0].split()
+ids = [x.split(";") for x in ids]
+ids = [item.strip() for sublist in ids for item in sublist if item != '']
 json_string = os.popen("curl -H \"Content-Type: text/plain\" -d \"$(printf '%s')\" -X POST --url www.reactome.org/AnalysisService/identifiers/\?pageSize\=1\&page\=1" % ids).read()
 if len(id_valid(identifiers[0].split())[1]) > 0:
 trash = id_valid(identifiers[0].split())[1]
 elif identifiers[1] == "file":
 header = identifiers[2]
-mq = open(identifiers[0]).readlines()
+with open(identifiers[0],"r") as mq :
-if isnumber("int", identifiers[3].replace("c", "")):
+file_content = csv.reader(mq,delimiter="\t")
-if header == "true":
+file_content = list(file_content)   #csv object to list
-idens = [x.split("\t")[int(identifiers[3].replace("c", ""))-1] for x in mq[1:]]
+ncol = identifiers[3]
-else:
+if isnumber("int", ncol.replace("c", "")):
-idens = [x.split("\t")[int(identifiers[3].replace("c", ""))-1] for x in mq]
+if header == "true":
-ids = "\n".join(id_valid(idens)[0])
+idens = [x for x in [line[int(ncol.replace("c", ""))-1].split(";") for line in file_content[1:]]]
-json_string = os.popen("curl -H \"Content-Type: text/plain\" -d \"$(printf '%s')\" -X POST --url www.reactome.org/AnalysisService/identifiers/\?pageSize\=1\&page\=1 2> stderr" % ids).read()
+else:
-if len(id_valid(idens)[1]) > 0:
+idens = [x for x in [line[int(ncol.replace("c", ""))-1].split(";") for line in file_content]]
-trash = id_valid(idens)[1]
+idens = [item.strip() for sublist in idens for item in sublist if item != '']   #flat list of list of lists, remove empty items
+ids = "\n".join(id_valid(idens)[0])
+json_string = os.popen("curl -H \"Content-Type: text/plain\" -d \"$(printf '%s')\" -X POST --url www.reactome.org/AnalysisService/identifiers/\?pageSize\=1\&page\=1 2> stderr" % ids).read()
+if len(id_valid(idens)[1]) > 0:
+trash = id_valid(idens)[1]
 #print(json_string)
 j = json.loads(json_string)
 print ("Identifiers not found: " + str(j["identifiersNotFound"]))
 print ("Pathways found: " + str(j["pathwaysFound"]))
 return json_string, trash

Mercurial > repos > proteore > proteore_reactome

comparison reactome_analysis.py @ 5:34097acf457c draft