fasta_extract: fasta_extract.py comparison

comparison fasta_extract.py @ 14:a234ed464674 draft default tip

Uploaded

author	greg
date	Sun, 10 Jan 2016 15:01:05 -0500
parents	a5d7ed2680c3
children

comparison

equal deleted inserted replaced

-:a5d7ed2680c3
+:a234ed464674
 parser.add_argument('--strand', dest='strand', help='Consider strandedness: reverse complement extracted sequence on reverse strand.')
 args = parser.parse_args()
 fasta = Fasta(args.genome_file)
-dh = open('debug.log', 'wb')
 for (input_filename, hid) in args.inputs:
 extend_existing = args.extend_existing == 'existing'
 consider_strand = args.strand == 'yes'
 reader = csv.reader(open(input_filename, 'rU'), delimiter='\t')
 fasta_output_path = get_output_path(hid,
 args.subtract_from_start,
 args.add_to_end,
 extend_existing,
 consider_strand)
-dh.write('\n fasta_output_path: %s\n' % str(fasta_output_path))
 output = open(fasta_output_path, 'wb')
 gff_output_path = get_output_path(hid,
 args.subtract_from_start,
 args.add_to_end,
 extend_existing,
 consider_strand,
 orphan=True)
-dh.write('\n gff_output_path: %s\n' % str(gff_output_path))
 orphan_writer = csv.writer(open(gff_output_path, 'wb'), delimiter='\t')
 for row in reader:
-dh.write('\n row: %s\n' % str(row))
 if len(row) != 9 or row[0].startswith('#'):
 continue
-try:
+cname = row[0]
-cname = row[0]
+start = int(row[3])
-start = int(row[3])
+end = int(row[4])
-end = int(row[4])
+strand = row[6]
-strand = row[6]
+if extend_existing:
-if extend_existing:
+start -= args.subtract_from_start
-start -= args.subtract_from_start
+end += args.add_to_end
-end += args.add_to_end
+else:
-else:
+midpoint = (start + end) // 2
-midpoint = (start + end) // 2
+start = midpoint - args.subtract_from_start
-start = midpoint - args.subtract_from_start
+end = midpoint + args.add_to_end
-end = midpoint + args.add_to_end
+if 1 <= start and end <= len(fasta[cname]):
-if 1 <= start and end <= len(fasta[cname]):
+output.write('>%s:%s-%s_%s\n' % (cname, start, end, strand))
-output.write('>%s:%s-%s_%s\n' % (cname, start, end, strand))
+bases = fasta[cname][start-1:end]
-bases = fasta[cname][start-1:end]
+if consider_strand and strand == '-':
-if consider_strand and strand == '-':
+bases = reverse_complement(bases)
-bases = reverse_complement(bases)
+output.write('%s\n' % bases)
-dh.write('\n bases: %s\n' % str(bases))
+else:
-output.write('%s\n' % bases)
+orphan_writer.writerow(row)
-else:
-orphan_writer.writerow(row)
-except Exception, e:
-stop_err(str(e))
 output.close()
-dh.close()

Mercurial > repos > greg > fasta_extract

comparison fasta_extract.py @ 14:a234ed464674 draft default tip