extract_genomic_dna: extract_genomic

comparison extract_genomic_dna.py @ 17:24c055f48065 draft

Uploaded

author	greg
date	Thu, 03 Mar 2016 14:52:35 -0500
parents	e70f5ca82b63
children

comparison

equal deleted inserted replaced

-:030691e5cc86
+:24c055f48065
 parser.add_argument('--interpret_features', dest='interpret_features', default=None, help="Interpret features if input format is gff")
 parser.add_argument('--columns', dest='columns', help="Columns to use in input file")
 parser.add_argument('--reference_genome_source', dest='reference_genome_source', help="Source of reference genome file")
 parser.add_argument('--reference_genome', dest='reference_genome', help="Reference genome file")
 parser.add_argument('--output_format', dest='output_format', help="Output format")
-parser.add_argument('--description_field_delimiter', dest='description_field_delimiter', default=None, help="Fasta description field delimiter")
+parser.add_argument('--fasta_header_type', dest='fasta_header_type', default=None, help="Fasta header format")
+parser.add_argument('--fasta_header_delimiter', dest='fasta_header_delimiter', default=None, help="Fasta header field delimiter")
 parser.add_argument('--output', dest='output', help="Output dataset")
 args = parser.parse_args()
 input_is_gff = args.input_format == 'gff'
 interpret_features = input_is_gff and args.interpret_features == "yes"
 if args.output_format == "fasta":
 l = len(sequence)
 c = 0
 if input_is_gff:
 start, end = egdu.convert_bed_coords_to_gff([start, end])
-fields = [args.genome, str(chrom), str(start), str(end), strand]
+if args.fasta_header_type == "bedtools_getfasta_default":
-field_delimiter = egdu.get_description_field_delimiter(args.description_field_delimiter)
+out.write(">%s\n" % egdu.get_bedtools_getfasta_default_header(str(chrom),
-meta_data = field_delimiter.join(fields)
+str(start),
-if name.strip():
+str(end),
-out.write(">%s %s\n" % (meta_data, name))
+strand,
-else:
+includes_strand_col))
-out.write(">%s\n" % meta_data)
+else:
+# args.fasta_header_type == "char_delimited":
+fields = [args.genome, str(chrom), str(start), str(end), strand]
+field_delimiter = egdu.get_fasta_header_delimiter(args.fasta_header_delimiter)
+meta_data = field_delimiter.join(fields)
+if name.strip():
+out.write(">%s %s\n" % (meta_data, name))
+else:
+out.write(">%s\n" % meta_data)
 while c < l:
 b = min(c + 50, l)
 out.write("%s\n" % str(sequence[c:b]))
 c = b
 else:
 feature.score,
 feature.strand,
 ".",
 egdu.gff_attributes_to_str(feature.attributes, "GTF")])
 else:
-# Where is fields being set here?
+# Here fields was set up around line 73.
 meta_data = "\t".join(fields)
 if input_is_gff:
 format_str = "%s seq \"%s\";\n"
 else:
 format_str = "%s\t%s\n"

Mercurial > repos > greg > extract_genomic_dna

comparison extract_genomic_dna.py @ 17:24c055f48065 draft