defuse: defuse.xml annotate

annotate defuse.xml @ 1:6ee9d8b45113

Fix sed options

author	Jim Johnson <jj@umn.edu>
date	Fri, 04 Jan 2013 13:07:16 -0600
parents	b75ea9927793
children	60a83037fd82

rev	line source
0 b75ea9927793 Uploaded jjohnson parents: diff changeset	1 <tool id="defuse" name="DeFuse" version="1.5">
b75ea9927793 Uploaded jjohnson parents: diff changeset	2 <description>identify fusion transcripts</description>
b75ea9927793 Uploaded jjohnson parents: diff changeset	3 <requirements>
b75ea9927793 Uploaded jjohnson parents: diff changeset	4 <requirement type="package" version="0.5.0">defuse</requirement>
b75ea9927793 Uploaded jjohnson parents: diff changeset	5 <requirement type="package">bowtie</requirement>
b75ea9927793 Uploaded jjohnson parents: diff changeset	6 <requirement type="package">blat</requirement>
b75ea9927793 Uploaded jjohnson parents: diff changeset	7 <requirement type="package">fatotwobit</requirement>
b75ea9927793 Uploaded jjohnson parents: diff changeset	8 </requirements>
b75ea9927793 Uploaded jjohnson parents: diff changeset	9 <command interpreter="command"> /bin/bash $shscript </command>
b75ea9927793 Uploaded jjohnson parents: diff changeset	10 <inputs>
b75ea9927793 Uploaded jjohnson parents: diff changeset	11 <param name="left_pairendreads" type="data" format="fastq" label="left part of read pairs" help="The left and right reads pairs must be in the same order, and not have any unpaired reads. (FASTQ interlacer will pair reads and remove the unpaired. FASTQ de-interlacer will separate the result into left and right reads.)"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	12 <param name="right_pairendreads" type="data" format="fastq" label="right part of read pairs" help="In the same order as the left reads"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	13 <conditional name="refGenomeSource">
b75ea9927793 Uploaded jjohnson parents: diff changeset	14 <param name="genomeSource" type="select" label="Will you select a built-in DeFuse Reference Dataset, or supply a configuration from your history" help="">
b75ea9927793 Uploaded jjohnson parents: diff changeset	15 <option value="indexed">Use a built-in DeFuse Reference Dataset</option>
b75ea9927793 Uploaded jjohnson parents: diff changeset	16 <option value="history">Use a configuration from your history that specifies the DeFuse Reference Dataset</option>
b75ea9927793 Uploaded jjohnson parents: diff changeset	17 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	18 <when value="indexed">
b75ea9927793 Uploaded jjohnson parents: diff changeset	19 <param name="index" type="select" label="Select a Reference Dataset" help="if your genome of interest is not listed - contact Galaxy team">
b75ea9927793 Uploaded jjohnson parents: diff changeset	20 <options from_file="defuse.loc">
b75ea9927793 Uploaded jjohnson parents: diff changeset	21 <column name="name" index="1"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	22 <column name="value" index="2"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	23 <filter type="sort_by" column="0" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	24 <validator type="no_options" message="No indexes are available" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	25 </options>
b75ea9927793 Uploaded jjohnson parents: diff changeset	26 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	27 <conditional name="defuse_param">
b75ea9927793 Uploaded jjohnson parents: diff changeset	28 <param name="settings" type="select" label="Defuse parameter settings" help="">
b75ea9927793 Uploaded jjohnson parents: diff changeset	29 <option value="preSet">Default settings</option>
b75ea9927793 Uploaded jjohnson parents: diff changeset	30 <option value="full">Full parameter list</option>
b75ea9927793 Uploaded jjohnson parents: diff changeset	31 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	32 <when value="preSet" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	33 <when value="full">
b75ea9927793 Uploaded jjohnson parents: diff changeset	34 <param name="max_insert_size" type="integer" value="500" optional="true" label="Bowtie max_insert_size" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	35 <param name="dna_concordant_length" type="integer" value="2000" optional="true" label="Minimum gene fusion range dna_concordant_length" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	36 <param name="discord_read_trim" type="integer" value="50" optional="true" label="Trim length for discordant reads discord_read_trim" help="(split reads are not trimmed)" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	37 <param name="clustering_precision" type="float" value=".95" optional="true" label="Filter clustering_precision">
b75ea9927793 Uploaded jjohnson parents: diff changeset	38 <validator type="in_range" message="Choose a value between .1 and 1.0" min=".1" max="1"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	39 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	40 <param name="span_count_threshold" type="integer" value="5" optional="true" label="Filter span_count_threshold" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	41 <param name="split_count_threshold" type="integer" value="3" optional="true" label="Filter split_count_threshold" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	42 <param name="percent_identity_threshold" type="float" value=".90" optional="true" label="Filter percent_identity_threshold">
b75ea9927793 Uploaded jjohnson parents: diff changeset	43 <validator type="in_range" message="Choose a value between .1 and 1.0" min=".1" max="1"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	44 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	45 <param name="max_dist_pos" type="integer" value="600" optional="true" label="Filter max_dist_pos" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	46 <param name="num_dist_genes" type="integer" value="500" optional="true" label="Filter num_dist_genes" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	47 <param name="split_min_anchor" type="integer" value="4" optional="true" label="Filter split_min_anchor" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	48 <param name="max_concordant_ratio" type="float" value="0.1" optional="true" label="Filter max_concordant_ratio">
b75ea9927793 Uploaded jjohnson parents: diff changeset	49 <validator type="in_range" message="Choose a value between 0.0 and 1.0" min="0" max="1"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	50 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	51 <param name="splice_bias" type="integer" value="10" optional="true" label="Filter splice_bias" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	52 <param name="probability_threshold" type="float" value="0.50" optional="true" label="Filter probability_threshold">
b75ea9927793 Uploaded jjohnson parents: diff changeset	53 <validator type="in_range" message="Choose a value between 0.0 and 1.0" min="0" max="1"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	54 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	55 <param name="covariance_sampling_density" type="float" value="0.01" optional="true" label="covariance_sampling_density">
b75ea9927793 Uploaded jjohnson parents: diff changeset	56 <help>Position density when calculating covariance</help>
b75ea9927793 Uploaded jjohnson parents: diff changeset	57 <validator type="in_range" message="Choose a value between 0.0 and 1.0" min="0" max="1"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	58 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	59 <param name="denovo_assembly" type="select" label="denovo_assembly" help="">
b75ea9927793 Uploaded jjohnson parents: diff changeset	60 <option value="">Use Default</option>
b75ea9927793 Uploaded jjohnson parents: diff changeset	61 <option value="no">no</option>
b75ea9927793 Uploaded jjohnson parents: diff changeset	62 <option value="yes">yes</option>
b75ea9927793 Uploaded jjohnson parents: diff changeset	63 </param>
b75ea9927793 Uploaded jjohnson parents: diff changeset	64 <!--
b75ea9927793 Uploaded jjohnson parents: diff changeset	65 <param name="positive_controls" type="data" format="txt" optional=true label="Defuse positive_controls" help=""/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	66 -->
b75ea9927793 Uploaded jjohnson parents: diff changeset	67 </when> <!-- full -->
b75ea9927793 Uploaded jjohnson parents: diff changeset	68 </conditional> <!-- defuse_param -->
b75ea9927793 Uploaded jjohnson parents: diff changeset	69 </when>
b75ea9927793 Uploaded jjohnson parents: diff changeset	70 <when value="history">
b75ea9927793 Uploaded jjohnson parents: diff changeset	71 <param name="config" type="data" format="txt" label="Defuse Config file" help=""/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	72 </when> <!-- history -->
b75ea9927793 Uploaded jjohnson parents: diff changeset	73 </conditional> <!-- refGenomeSource -->
b75ea9927793 Uploaded jjohnson parents: diff changeset	74 <param name="keep_output" type="boolean" checked="true" truevalue="yes" falsevalue="no" label="Save DeFuse working directory files"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	75 <param name="do_get_reads" type="boolean" checked="false" truevalue="yes" falsevalue="no" label="Run get_reads on each cluster"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	76 </inputs>
b75ea9927793 Uploaded jjohnson parents: diff changeset	77 <configfiles>
b75ea9927793 Uploaded jjohnson parents: diff changeset	78 <configfile name="defuse_config">
b75ea9927793 Uploaded jjohnson parents: diff changeset	79 #import ast
b75ea9927793 Uploaded jjohnson parents: diff changeset	80 #if $refGenomeSource.genomeSource == "history":
b75ea9927793 Uploaded jjohnson parents: diff changeset	81 #include raw $refGenomeSource.config.__str__
b75ea9927793 Uploaded jjohnson parents: diff changeset	82 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	83 #set $ref_dict = dict($ast.literal_eval($refGenomeSource.index.value))
b75ea9927793 Uploaded jjohnson parents: diff changeset	84 #
b75ea9927793 Uploaded jjohnson parents: diff changeset	85 # Configuration file for defuse
b75ea9927793 Uploaded jjohnson parents: diff changeset	86 #
b75ea9927793 Uploaded jjohnson parents: diff changeset	87 # At a minimum, change all values enclused by []
b75ea9927793 Uploaded jjohnson parents: diff changeset	88 #
b75ea9927793 Uploaded jjohnson parents: diff changeset	89
b75ea9927793 Uploaded jjohnson parents: diff changeset	90 # Directory where the defuse code was unpacked
b75ea9927793 Uploaded jjohnson parents: diff changeset	91 ## Default location in the tool/defuse directory
b75ea9927793 Uploaded jjohnson parents: diff changeset	92 # source_directory = ${__root_dir__}/tools/defuse
b75ea9927793 Uploaded jjohnson parents: diff changeset	93 source_directory = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	94 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	95 $ref_dict['source_directory']
b75ea9927793 Uploaded jjohnson parents: diff changeset	96 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	97 __DEFUSE_PATH__
b75ea9927793 Uploaded jjohnson parents: diff changeset	98 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	99
b75ea9927793 Uploaded jjohnson parents: diff changeset	100 # Directory where you want your dataset
b75ea9927793 Uploaded jjohnson parents: diff changeset	101 dataset_directory = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	102 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	103 $ref_dict['dataset_directory']
b75ea9927793 Uploaded jjohnson parents: diff changeset	104 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	105 /project/db/genomes/Hsapiens/hg19/defuse
b75ea9927793 Uploaded jjohnson parents: diff changeset	106 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	107
b75ea9927793 Uploaded jjohnson parents: diff changeset	108 # Input genome and gene models
b75ea9927793 Uploaded jjohnson parents: diff changeset	109 gene_models = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	110 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	111 $ref_dict['gene_models']
b75ea9927793 Uploaded jjohnson parents: diff changeset	112 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	113 \$(dataset_directory)/Homo_sapiens.GRCh37.62.gtf
b75ea9927793 Uploaded jjohnson parents: diff changeset	114 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	115 genome_fasta = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	116 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	117 $ref_dict['genome_fasta']
b75ea9927793 Uploaded jjohnson parents: diff changeset	118 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	119 \$(dataset_directory)/Homo_sapiens.GRCh37.62.dna.chromosome.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	120 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	121
b75ea9927793 Uploaded jjohnson parents: diff changeset	122 # Repeat table from ucsc genome browser
b75ea9927793 Uploaded jjohnson parents: diff changeset	123 repeats_filename = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	124 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	125 $ref_dict['repeats_filename']
b75ea9927793 Uploaded jjohnson parents: diff changeset	126 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	127 \$(dataset_directory)/rmsk.txt
b75ea9927793 Uploaded jjohnson parents: diff changeset	128 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	129
b75ea9927793 Uploaded jjohnson parents: diff changeset	130 # EST info downloaded from ucsc genome browser
b75ea9927793 Uploaded jjohnson parents: diff changeset	131 est_fasta = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	132 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	133 $ref_dict['est_fasta']
b75ea9927793 Uploaded jjohnson parents: diff changeset	134 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	135 \$(dataset_directory)/est.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	136 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	137 est_alignments = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	138 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	139 $ref_dict['est_alignments']
b75ea9927793 Uploaded jjohnson parents: diff changeset	140 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	141 \$(dataset_directory)/intronEst.txt
b75ea9927793 Uploaded jjohnson parents: diff changeset	142 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	143
b75ea9927793 Uploaded jjohnson parents: diff changeset	144 # Unigene clusters downloaded from ncbi
b75ea9927793 Uploaded jjohnson parents: diff changeset	145 unigene_fasta = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	146 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	147 $ref_dict['unigene_fasta']
b75ea9927793 Uploaded jjohnson parents: diff changeset	148 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	149 \$(dataset_directory)/Hs.seq.uniq
b75ea9927793 Uploaded jjohnson parents: diff changeset	150 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	151
b75ea9927793 Uploaded jjohnson parents: diff changeset	152 # Paths to external tools
b75ea9927793 Uploaded jjohnson parents: diff changeset	153 bowtie_bin = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	154 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	155 $ref_dict['bowtie_bin']
b75ea9927793 Uploaded jjohnson parents: diff changeset	156 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	157 __BOWTIE_BIN__
b75ea9927793 Uploaded jjohnson parents: diff changeset	158 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	159 bowtie_build_bin = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	160 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	161 $ref_dict['bowtie_build_bin']
b75ea9927793 Uploaded jjohnson parents: diff changeset	162 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	163 __BOWTIE_BUILD_BIN__
b75ea9927793 Uploaded jjohnson parents: diff changeset	164 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	165 blat_bin = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	166 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	167 $ref_dict['blat_bin']
b75ea9927793 Uploaded jjohnson parents: diff changeset	168 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	169 __BLAT_BIN__
b75ea9927793 Uploaded jjohnson parents: diff changeset	170 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	171 fatotwobit_bin = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	172 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	173 $ref_dict['fatotwobit_bin']
b75ea9927793 Uploaded jjohnson parents: diff changeset	174 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	175 __FATOTWOBIT_BIN__
b75ea9927793 Uploaded jjohnson parents: diff changeset	176 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	177 r_bin = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	178 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	179 $ref_dict['r_bin']
b75ea9927793 Uploaded jjohnson parents: diff changeset	180 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	181 __R_BIN__
b75ea9927793 Uploaded jjohnson parents: diff changeset	182 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	183 rscript_bin = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	184 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	185 $ref_dict['rscript_bin']
b75ea9927793 Uploaded jjohnson parents: diff changeset	186 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	187 __RSCRIPT_BIN__
b75ea9927793 Uploaded jjohnson parents: diff changeset	188 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	189
b75ea9927793 Uploaded jjohnson parents: diff changeset	190 #raw
b75ea9927793 Uploaded jjohnson parents: diff changeset	191 # Dataset files
b75ea9927793 Uploaded jjohnson parents: diff changeset	192 dataset_prefix = $(dataset_directory)/defuse
b75ea9927793 Uploaded jjohnson parents: diff changeset	193 chromosome_prefix = $(dataset_prefix).dna.chromosomes
b75ea9927793 Uploaded jjohnson parents: diff changeset	194 exons_fasta = $(dataset_prefix).exons.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	195 cds_fasta = $(dataset_prefix).cds.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	196 cdna_regions = $(dataset_prefix).cdna.regions
b75ea9927793 Uploaded jjohnson parents: diff changeset	197 cdna_fasta = $(dataset_prefix).cdna.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	198 reference_fasta = $(dataset_prefix).reference.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	199 rrna_fasta = $(dataset_prefix).rrna.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	200 ig_gene_list = $(dataset_prefix).ig.gene.list
b75ea9927793 Uploaded jjohnson parents: diff changeset	201 repeats_regions = $(dataset_directory)/repeats.regions
b75ea9927793 Uploaded jjohnson parents: diff changeset	202 est_split_fasta1 = $(dataset_directory)/est.1.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	203 est_split_fasta2 = $(dataset_directory)/est.2.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	204 est_split_fasta3 = $(dataset_directory)/est.3.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	205 est_split_fasta4 = $(dataset_directory)/est.4.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	206 est_split_fasta5 = $(dataset_directory)/est.5.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	207 est_split_fasta6 = $(dataset_directory)/est.6.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	208 est_split_fasta7 = $(dataset_directory)/est.7.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	209 est_split_fasta8 = $(dataset_directory)/est.8.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	210 est_split_fasta9 = $(dataset_directory)/est.9.fa
b75ea9927793 Uploaded jjohnson parents: diff changeset	211
b75ea9927793 Uploaded jjohnson parents: diff changeset	212 # Fasta files with bowtie indices for prefiltering reads for concordantly mapping pairs
b75ea9927793 Uploaded jjohnson parents: diff changeset	213 prefilter1 = $(unigene_fasta)
b75ea9927793 Uploaded jjohnson parents: diff changeset	214
b75ea9927793 Uploaded jjohnson parents: diff changeset	215 # deFuse scripts and tools
b75ea9927793 Uploaded jjohnson parents: diff changeset	216 scripts_directory = $(source_directory)/scripts
b75ea9927793 Uploaded jjohnson parents: diff changeset	217 tools_directory = $(source_directory)/tools
b75ea9927793 Uploaded jjohnson parents: diff changeset	218 data_directory = $(source_directory)/data
b75ea9927793 Uploaded jjohnson parents: diff changeset	219 #end raw
b75ea9927793 Uploaded jjohnson parents: diff changeset	220
b75ea9927793 Uploaded jjohnson parents: diff changeset	221 # Path to samtools, 0.1.8 is compiled for you, use other versions at your own risk
b75ea9927793 Uploaded jjohnson parents: diff changeset	222 samtools_bin = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	223 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	224 $ref_dict['samtools_bin']
b75ea9927793 Uploaded jjohnson parents: diff changeset	225 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	226 \$(source_directory)/external/samtools-0.1.8/samtools
b75ea9927793 Uploaded jjohnson parents: diff changeset	227 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	228
b75ea9927793 Uploaded jjohnson parents: diff changeset	229 # Bowtie parameters
b75ea9927793 Uploaded jjohnson parents: diff changeset	230 bowtie_threads = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	231 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	232 $ref_dict['bowtie_threads']
b75ea9927793 Uploaded jjohnson parents: diff changeset	233 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	234 4
b75ea9927793 Uploaded jjohnson parents: diff changeset	235 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	236 bowtie_quals = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	237 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	238 $ref_dict['bowtie_quals']
b75ea9927793 Uploaded jjohnson parents: diff changeset	239 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	240 --phred33-quals
b75ea9927793 Uploaded jjohnson parents: diff changeset	241 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	242 max_insert_size = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	243 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.max_insert_size.__str__ != "":
b75ea9927793 Uploaded jjohnson parents: diff changeset	244 $refGenomeSource.defuse_param.max_insert_size
b75ea9927793 Uploaded jjohnson parents: diff changeset	245 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	246 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	247 $ref_dict['max_insert_size']
b75ea9927793 Uploaded jjohnson parents: diff changeset	248 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	249 500
b75ea9927793 Uploaded jjohnson parents: diff changeset	250 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	251 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	252
b75ea9927793 Uploaded jjohnson parents: diff changeset	253 # Parameters for building the dataset
b75ea9927793 Uploaded jjohnson parents: diff changeset	254 chromosomes = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	255 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	256 $ref_dict.chromosomes
b75ea9927793 Uploaded jjohnson parents: diff changeset	257 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	258 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y,MT
b75ea9927793 Uploaded jjohnson parents: diff changeset	259 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	260 mt_chromosome = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	261 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	262 $ref_dict['mt_chromosome']
b75ea9927793 Uploaded jjohnson parents: diff changeset	263 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	264 MT
b75ea9927793 Uploaded jjohnson parents: diff changeset	265 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	266 gene_sources = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	267 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	268 $ref_dict['gene_sources']
b75ea9927793 Uploaded jjohnson parents: diff changeset	269 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	270 IG_C_gene,IG_D_gene,IG_J_gene,IG_V_gene,processed_transcript,protein_coding
b75ea9927793 Uploaded jjohnson parents: diff changeset	271 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	272 ig_gene_sources = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	273 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	274 $ref_dict['ig_gene_sources']
b75ea9927793 Uploaded jjohnson parents: diff changeset	275 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	276 IG_C_gene,IG_D_gene,IG_J_gene,IG_V_gene,IG_pseudogene
b75ea9927793 Uploaded jjohnson parents: diff changeset	277 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	278 rrna_gene_sources = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	279 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	280 $ref_dict['rrna_gene_sources']
b75ea9927793 Uploaded jjohnson parents: diff changeset	281 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	282 Mt_rRNA,rRNA,rRNA_pseudogene
b75ea9927793 Uploaded jjohnson parents: diff changeset	283 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	284
b75ea9927793 Uploaded jjohnson parents: diff changeset	285 # Blat sequences per job
b75ea9927793 Uploaded jjohnson parents: diff changeset	286 num_blat_sequences = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	287 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	288 $ref_dict['num_blat_sequences']
b75ea9927793 Uploaded jjohnson parents: diff changeset	289 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	290 10000
b75ea9927793 Uploaded jjohnson parents: diff changeset	291 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	292
b75ea9927793 Uploaded jjohnson parents: diff changeset	293 # Minimum gene fusion range
b75ea9927793 Uploaded jjohnson parents: diff changeset	294 dna_concordant_length = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	295 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.dna_concordant_length.__str__ != "":
b75ea9927793 Uploaded jjohnson parents: diff changeset	296 $refGenomeSource.defuse_param.dna_concordant_length
b75ea9927793 Uploaded jjohnson parents: diff changeset	297 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	298 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	299 $ref_dict['dna_concordant_length']
b75ea9927793 Uploaded jjohnson parents: diff changeset	300 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	301 2000
b75ea9927793 Uploaded jjohnson parents: diff changeset	302 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	303 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	304
b75ea9927793 Uploaded jjohnson parents: diff changeset	305 # Trim length for discordant reads (split reads are not trimmed)
b75ea9927793 Uploaded jjohnson parents: diff changeset	306 discord_read_trim = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	307 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.discord_read_trim.__str__ != "":
b75ea9927793 Uploaded jjohnson parents: diff changeset	308 $refGenomeSource.defuse_param.discord_read_trim
b75ea9927793 Uploaded jjohnson parents: diff changeset	309 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	310 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	311 $ref_dict['discord_read_trim']
b75ea9927793 Uploaded jjohnson parents: diff changeset	312 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	313 50
b75ea9927793 Uploaded jjohnson parents: diff changeset	314 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	315 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	316
b75ea9927793 Uploaded jjohnson parents: diff changeset	317 # Filtering parameters
b75ea9927793 Uploaded jjohnson parents: diff changeset	318 clustering_precision = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	319 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.clustering_precision.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	320 $refGenomeSource.defuse_param.clustering_precision
b75ea9927793 Uploaded jjohnson parents: diff changeset	321 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	322 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	323 $ref_dict['clustering_precision']
b75ea9927793 Uploaded jjohnson parents: diff changeset	324 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	325 0.95
b75ea9927793 Uploaded jjohnson parents: diff changeset	326 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	327 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	328 span_count_threshold = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	329 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.span_count_threshold.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	330 $refGenomeSource.defuse_param.span_count_threshold
b75ea9927793 Uploaded jjohnson parents: diff changeset	331 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	332 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	333 $ref_dict['span_count_threshold']
b75ea9927793 Uploaded jjohnson parents: diff changeset	334 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	335 5
b75ea9927793 Uploaded jjohnson parents: diff changeset	336 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	337 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	338 split_count_threshold = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	339 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.split_count_threshold.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	340 $refGenomeSource.defuse_param.split_count_threshold
b75ea9927793 Uploaded jjohnson parents: diff changeset	341 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	342 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	343 $ref_dict['split_count_threshold']
b75ea9927793 Uploaded jjohnson parents: diff changeset	344 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	345 3
b75ea9927793 Uploaded jjohnson parents: diff changeset	346 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	347 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	348 percent_identity_threshold = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	349 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.percent_identity_threshold.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	350 $refGenomeSource.defuse_param.percent_identity_threshold
b75ea9927793 Uploaded jjohnson parents: diff changeset	351 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	352 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	353 $ref_dict['percent_identity_threshold']
b75ea9927793 Uploaded jjohnson parents: diff changeset	354 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	355 0.90
b75ea9927793 Uploaded jjohnson parents: diff changeset	356 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	357 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	358 max_dist_pos = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	359 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.max_dist_pos.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	360 $refGenomeSource.defuse_param.max_dist_pos
b75ea9927793 Uploaded jjohnson parents: diff changeset	361 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	362 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	363 $ref_dict['max_dist_pos']
b75ea9927793 Uploaded jjohnson parents: diff changeset	364 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	365 600
b75ea9927793 Uploaded jjohnson parents: diff changeset	366 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	367 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	368 num_dist_genes = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	369 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.num_dist_genes.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	370 $refGenomeSource.defuse_param.num_dist_genes
b75ea9927793 Uploaded jjohnson parents: diff changeset	371 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	372 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	373 $ref_dict['num_dist_genes']
b75ea9927793 Uploaded jjohnson parents: diff changeset	374 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	375 500
b75ea9927793 Uploaded jjohnson parents: diff changeset	376 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	377 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	378 split_min_anchor = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	379 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.split_min_anchor.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	380 $refGenomeSource.defuse_param.split_min_anchor
b75ea9927793 Uploaded jjohnson parents: diff changeset	381 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	382 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	383 $ref_dict['split_min_anchor']
b75ea9927793 Uploaded jjohnson parents: diff changeset	384 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	385 4
b75ea9927793 Uploaded jjohnson parents: diff changeset	386 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	387 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	388 max_concordant_ratio = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	389 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.max_concordant_ratio.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	390 $refGenomeSource.defuse_param.max_concordant_ratio
b75ea9927793 Uploaded jjohnson parents: diff changeset	391 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	392 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	393 $ref_dict['max_concordant_ratio']
b75ea9927793 Uploaded jjohnson parents: diff changeset	394 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	395 0.1
b75ea9927793 Uploaded jjohnson parents: diff changeset	396 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	397 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	398 splice_bias = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	399 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.splice_bias.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	400 $refGenomeSource.defuse_param.splice_bias
b75ea9927793 Uploaded jjohnson parents: diff changeset	401 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	402 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	403 $ref_dict['splice_bias']
b75ea9927793 Uploaded jjohnson parents: diff changeset	404 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	405 10
b75ea9927793 Uploaded jjohnson parents: diff changeset	406 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	407 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	408 denovo_assembly = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	409 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.denovo_assembly.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	410 $refGenomeSource.defuse_param.denovo_assembly
b75ea9927793 Uploaded jjohnson parents: diff changeset	411 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	412 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	413 $ref_dict['denovo_assembly']
b75ea9927793 Uploaded jjohnson parents: diff changeset	414 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	415 no
b75ea9927793 Uploaded jjohnson parents: diff changeset	416 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	417 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	418 probability_threshold = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	419 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.probability_threshold.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	420 $refGenomeSource.defuse_param.probability_threshold
b75ea9927793 Uploaded jjohnson parents: diff changeset	421 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	422 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	423 $ref_dict['probability_threshold']
b75ea9927793 Uploaded jjohnson parents: diff changeset	424 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	425 0.50
b75ea9927793 Uploaded jjohnson parents: diff changeset	426 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	427 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	428 positive_controls = \$(data_directory)/controls.txt
b75ea9927793 Uploaded jjohnson parents: diff changeset	429
b75ea9927793 Uploaded jjohnson parents: diff changeset	430 # Position density when calculating covariance
b75ea9927793 Uploaded jjohnson parents: diff changeset	431 covariance_sampling_density = #slurp
b75ea9927793 Uploaded jjohnson parents: diff changeset	432 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.covariance_sampling_density.__str__ != ""
b75ea9927793 Uploaded jjohnson parents: diff changeset	433 $refGenomeSource.defuse_param.covariance_sampling_density
b75ea9927793 Uploaded jjohnson parents: diff changeset	434 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	435 #try
b75ea9927793 Uploaded jjohnson parents: diff changeset	436 $ref_dict['covariance_sampling_density']
b75ea9927793 Uploaded jjohnson parents: diff changeset	437 #except
b75ea9927793 Uploaded jjohnson parents: diff changeset	438 0.01
b75ea9927793 Uploaded jjohnson parents: diff changeset	439 #end try
b75ea9927793 Uploaded jjohnson parents: diff changeset	440 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	441
b75ea9927793 Uploaded jjohnson parents: diff changeset	442
b75ea9927793 Uploaded jjohnson parents: diff changeset	443 # Number of reads for each job in split
b75ea9927793 Uploaded jjohnson parents: diff changeset	444 reads_per_job = 1000000
b75ea9927793 Uploaded jjohnson parents: diff changeset	445
b75ea9927793 Uploaded jjohnson parents: diff changeset	446 # Number of regions for each breakpoint sequence job in split
b75ea9927793 Uploaded jjohnson parents: diff changeset	447 regions_per_job = 20
b75ea9927793 Uploaded jjohnson parents: diff changeset	448
b75ea9927793 Uploaded jjohnson parents: diff changeset	449 #raw
b75ea9927793 Uploaded jjohnson parents: diff changeset	450 # If you have command line 'mail' and wish to be notified
b75ea9927793 Uploaded jjohnson parents: diff changeset	451 # mailto = andrew.mcpherson@gmail.com
b75ea9927793 Uploaded jjohnson parents: diff changeset	452
b75ea9927793 Uploaded jjohnson parents: diff changeset	453 # Remove temp files
b75ea9927793 Uploaded jjohnson parents: diff changeset	454 remove_job_files = yes
b75ea9927793 Uploaded jjohnson parents: diff changeset	455 remove_job_temp_files = yes
b75ea9927793 Uploaded jjohnson parents: diff changeset	456
b75ea9927793 Uploaded jjohnson parents: diff changeset	457 # Converting to fastq
b75ea9927793 Uploaded jjohnson parents: diff changeset	458 # Fastq converter config format 1 for reads stored in separate files for each end
b75ea9927793 Uploaded jjohnson parents: diff changeset	459 # data_lane_rexex_N is a perl regex which stores the lane id in $1
b75ea9927793 Uploaded jjohnson parents: diff changeset	460 # data_end_regex_N is a perl regex which stores the end, 1 or 2, in $1
b75ea9927793 Uploaded jjohnson parents: diff changeset	461 # data_compress_regex_N is a perl regex which stores the compression extension in $1
b75ea9927793 Uploaded jjohnson parents: diff changeset	462 # data_convert_N is the associated conversion utility that takes data at stdin and outputs fastq at stdout
b75ea9927793 Uploaded jjohnson parents: diff changeset	463 # Fastq converter config format 2 for reads stored in separate files for each end
b75ea9927793 Uploaded jjohnson parents: diff changeset	464 # data_lane_regex_N is a perl regex which stores the lane id in $1
b75ea9927793 Uploaded jjohnson parents: diff changeset	465 # data_compress_regex_N is a perl regex which stores the compression extension in $1
b75ea9927793 Uploaded jjohnson parents: diff changeset	466 # data_end1_converter_N is the associated conversion utility that takes data at stdin and outputs fastq for end 1 at stdout
b75ea9927793 Uploaded jjohnson parents: diff changeset	467 # data_end2_converter_N is the associated conversion utility that takes data at stdin and outputs fastq for end 2 at stdout
b75ea9927793 Uploaded jjohnson parents: diff changeset	468
b75ea9927793 Uploaded jjohnson parents: diff changeset	469 data_lane_regex_1 = ^(.+)_[12]_export\.txt.*$
b75ea9927793 Uploaded jjohnson parents: diff changeset	470 data_end_regex_1 = ^.+_([12])_export\.txt.*$
b75ea9927793 Uploaded jjohnson parents: diff changeset	471 data_compress_regex_1 = ^.+_[12]_export\.txt(.*)$
b75ea9927793 Uploaded jjohnson parents: diff changeset	472 data_converter_1 = $(scripts_directory)/fq_all2std.pl export2std
b75ea9927793 Uploaded jjohnson parents: diff changeset	473
b75ea9927793 Uploaded jjohnson parents: diff changeset	474 data_lane_regex_2 = ^(.+)_[12]_concat_qseq\.txt.*$
b75ea9927793 Uploaded jjohnson parents: diff changeset	475 data_end_regex_2 = ^.+_([12])_concat_qseq\.txt.*$
b75ea9927793 Uploaded jjohnson parents: diff changeset	476 data_compress_regex_2 = ^.+_[12]_concat_qseq\.txt(.*)$
b75ea9927793 Uploaded jjohnson parents: diff changeset	477 data_converter_2 = $(scripts_directory)/qseq2fastq.pl
b75ea9927793 Uploaded jjohnson parents: diff changeset	478
b75ea9927793 Uploaded jjohnson parents: diff changeset	479 data_lane_regex_3 = ^(.+)\.bam.*$
b75ea9927793 Uploaded jjohnson parents: diff changeset	480 data_compress_regex_3 = ^.+\.bam(.*)$
b75ea9927793 Uploaded jjohnson parents: diff changeset	481 data_end1_converter_3 = samtools view - \| filter_sam_mate.pl 1 \| sam_to_fastq.pl
b75ea9927793 Uploaded jjohnson parents: diff changeset	482 data_end2_converter_3 = samtools view - \| filter_sam_mate.pl 2 \| sam_to_fastq.pl
b75ea9927793 Uploaded jjohnson parents: diff changeset	483
b75ea9927793 Uploaded jjohnson parents: diff changeset	484 data_lane_regex_4 = ^(.+).[12].fastq.*$
b75ea9927793 Uploaded jjohnson parents: diff changeset	485 data_end_regex_4 = ^.+.([12]).fastq.*$
b75ea9927793 Uploaded jjohnson parents: diff changeset	486 data_compress_regex_4 = ^.+.[12].fastq(.*)$
b75ea9927793 Uploaded jjohnson parents: diff changeset	487 data_converter_4 = cat
b75ea9927793 Uploaded jjohnson parents: diff changeset	488 #end raw
b75ea9927793 Uploaded jjohnson parents: diff changeset	489
b75ea9927793 Uploaded jjohnson parents: diff changeset	490 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	491
b75ea9927793 Uploaded jjohnson parents: diff changeset	492 </configfile>
b75ea9927793 Uploaded jjohnson parents: diff changeset	493 <configfile name="shscript">
b75ea9927793 Uploaded jjohnson parents: diff changeset	494 #!/bin/bash
b75ea9927793 Uploaded jjohnson parents: diff changeset	495 ## define some things for cheetah proccessing
b75ea9927793 Uploaded jjohnson parents: diff changeset	496 #set $ds = chr(36)
b75ea9927793 Uploaded jjohnson parents: diff changeset	497 #set $amp = chr(38)
b75ea9927793 Uploaded jjohnson parents: diff changeset	498 #set $gt = chr(62)
b75ea9927793 Uploaded jjohnson parents: diff changeset	499 #set $lt = chr(60)
b75ea9927793 Uploaded jjohnson parents: diff changeset	500 #set $echo_cmd = 'echo'
b75ea9927793 Uploaded jjohnson parents: diff changeset	501 ## Find the defuse.pl in the galaxy tool path
b75ea9927793 Uploaded jjohnson parents: diff changeset	502 #import Cheetah.FileUtils
b75ea9927793 Uploaded jjohnson parents: diff changeset	503 ## declare a bash function for converting a results tsv into html with links to the get_reads output files
b75ea9927793 Uploaded jjohnson parents: diff changeset	504 results2html() {
b75ea9927793 Uploaded jjohnson parents: diff changeset	505 rlts=${ds}1
b75ea9927793 Uploaded jjohnson parents: diff changeset	506 rslt_name=`basename ${ds}rlts`
b75ea9927793 Uploaded jjohnson parents: diff changeset	507 html=${ds}2
b75ea9927793 Uploaded jjohnson parents: diff changeset	508 echo '${lt}html${gt}${lt}head${gt}${lt}title${gt}Defuse '${ds}rslt_name'${lt}/title${gt}${lt}/head${gt}${lt}body${gt}' ${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	509 echo '${lt}h2${gt}Defuse '${ds}rslt_name'${lt}/h2${gt}${lt}table${gt}' ${gt}${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	510 if [ -z "${ds}3" ]
b75ea9927793 Uploaded jjohnson parents: diff changeset	511 then
b75ea9927793 Uploaded jjohnson parents: diff changeset	512 awk '${ds}1 ~ /cluster_id/{printf("${lt}tr${gt}");for (i = 1; i ${lt}= NF; i++) {printf("${lt}th${gt}%s${lt}/th${gt}", ${ds}i);}; printf("${lt}/tr${gt}\n");}\
b75ea9927793 Uploaded jjohnson parents: diff changeset	513 ${ds}1 ~ /[1-9][0-9]*/{printf("${lt}tr${gt}");for (i = 1; i ${lt}= NF; i++) {printf("${lt}td${gt}%s${lt}/td${gt}", ${ds}i);}; printf("${lt}/tr${gt}\n");}' ${ds}rlts ${gt}${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	514 echo '${lt}/table${gt}' ${gt}${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	515 echo '${lt}/body${gt}${lt}/html${gt}' ${gt}${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	516 else
b75ea9927793 Uploaded jjohnson parents: diff changeset	517 export _EFP=${ds}3
b75ea9927793 Uploaded jjohnson parents: diff changeset	518 mkdir -p ${ds}_EFP
b75ea9927793 Uploaded jjohnson parents: diff changeset	519 awk '${ds}1 ~ /cluster_id/{printf("${lt}tr${gt}");for (i = 1; i ${lt}= NF; i++) {printf("${lt}th${gt}%s${lt}/th${gt}", ${ds}i);}; printf("${lt}/tr${gt}\n");}\
b75ea9927793 Uploaded jjohnson parents: diff changeset	520 ${ds}1 ~ /[1-9][0-9]*/{fn="cluster_"${ds}1"_reads.txt"; \
b75ea9927793 Uploaded jjohnson parents: diff changeset	521 printf("${lt}tr${gt}${lt}td${gt}${lt}a href=\"%s\"${gt}%s${lt}/a${gt}${lt}/td${gt}",fn, ${ds}1);for (i = 2; i ${lt}= NF; i++) {printf("${lt}td${gt}%s${lt}/td${gt}", ${ds}i);}; printf("${lt}/tr${gt}\n");}' ${ds}rlts ${gt}${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	522 echo '${lt}/table${gt}' ${gt}${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	523 echo '${lt}/body${gt}${lt}/html${gt}' ${gt}${gt} ${ds}html
b75ea9927793 Uploaded jjohnson parents: diff changeset	524 for i in `awk '${ds}1 ~ /[1-9][0-9]*/{print ${ds}1}' ${ds}rlts`;
b75ea9927793 Uploaded jjohnson parents: diff changeset	525 do fn=cluster_${ds}{i}_reads.txt;
b75ea9927793 Uploaded jjohnson parents: diff changeset	526 pn=${ds}_EFP/${ds}fn;
b75ea9927793 Uploaded jjohnson parents: diff changeset	527 perl \${DEFUSE_PATH}/scripts/get_reads.pl -c $defuse_config -o output_dir -i ${ds}i ${gt} ${ds}pn;
b75ea9927793 Uploaded jjohnson parents: diff changeset	528 done
b75ea9927793 Uploaded jjohnson parents: diff changeset	529 fi
b75ea9927793 Uploaded jjohnson parents: diff changeset	530 }
b75ea9927793 Uploaded jjohnson parents: diff changeset	531 ## substitute pathnames into config file
1 6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	532 if `grep __DEFUSE_PATH__ $defuse_config ${gt} /dev/null`;then sed -i'.tmp' "s#__DEFUSE_PATH__#\${DEFUSE_PATH}#" $defuse_config; fi
6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	533 if `grep __SAMTOOLS_BIN__ $defuse_config ${gt} /dev/null` ${amp}${amp} SAMTOOLS_BIN=`which samtools`;then sed -i'.tmp' "s#__SAMTOOLS_BIN__#\${SAMTOOLS_BIN}#" $defuse_config; fi
6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	534 if `grep __BOWTIE_BIN__ $defuse_config ${gt} /dev/null` ${amp}${amp} BOWTIE_BIN=`which bowtie`;then sed -i'.tmp' "s#__BOWTIE_BIN__#\${BOWTIE_BIN}#" $defuse_config; fi
6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	535 if `grep __BOWTIE_BUILD_BIN__ $defuse_config ${gt} /dev/null` ${amp}${amp} BOWTIE_BUILD_BIN=`which bowtie-build`;then sed -i'.tmp' "s#__BOWTIE_BUILD_BIN__#\${BOWTIE_BUILD_BIN}#" $defuse_config; fi
6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	536 if `grep __BLAT_BIN__ $defuse_config ${gt} /dev/null` ${amp}${amp} BLAT_BIN=`which blat`;then sed -i'.tmp' "s#__BLAT_BIN__#\${BLAT_BIN}#" $defuse_config; fi
6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	537 if `grep __FATOTWOBIT_BIN__ $defuse_config ${gt} /dev/null` ${amp}${amp} FATOTWOBIT_BIN=`which fatotwobit`;then sed -i'.tmp' "s#__FATOTWOBIT_BIN__#\${FATOTWOBIT_BIN}#" $defuse_config; fi
6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	538 if `grep __R_BIN__ $defuse_config ${gt} /dev/null` ${amp}${amp} R_BIN=`which R`;then sed -i'.tmp' "s#__R_BIN__#\${R_BIN}#" $defuse_config; fi
6ee9d8b45113 Fix sed options Jim Johnson <jj@umn.edu> parents: 0 diff changeset	539 if `grep __RSCRIPT_BIN__ $defuse_config ${gt} /dev/null` ${amp}${amp} RSCRIPT_BIN=`which Rscript`;then sed -i'.tmp' "s#__RSCRIPT_BIN__#\${RSCRIPT_BIN}#" $defuse_config; fi
0 b75ea9927793 Uploaded jjohnson parents: diff changeset	540
b75ea9927793 Uploaded jjohnson parents: diff changeset	541
b75ea9927793 Uploaded jjohnson parents: diff changeset	542 ## copy config to output
b75ea9927793 Uploaded jjohnson parents: diff changeset	543 cp $defuse_config $config_txt
b75ea9927793 Uploaded jjohnson parents: diff changeset	544 ## make a data_dir and ln -s the input fastq
b75ea9927793 Uploaded jjohnson parents: diff changeset	545 mkdir -p data_dir
b75ea9927793 Uploaded jjohnson parents: diff changeset	546 ln -s $left_pairendreads data_dir/reads_1.fastq
b75ea9927793 Uploaded jjohnson parents: diff changeset	547 ln -s $right_pairendreads data_dir/reads_2.fastq
b75ea9927793 Uploaded jjohnson parents: diff changeset	548 ## ln to output_dir in from_work_dir
b75ea9927793 Uploaded jjohnson parents: diff changeset	549 #if $defuse_out.__str__ != 'None':
b75ea9927793 Uploaded jjohnson parents: diff changeset	550 mkdir -p $defuse_out.extra_files_path
b75ea9927793 Uploaded jjohnson parents: diff changeset	551 ln -s $defuse_out.extra_files_path output_dir
b75ea9927793 Uploaded jjohnson parents: diff changeset	552 #else
b75ea9927793 Uploaded jjohnson parents: diff changeset	553 mkdir -p output_dir
b75ea9927793 Uploaded jjohnson parents: diff changeset	554 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	555 ## run defuse.pl
b75ea9927793 Uploaded jjohnson parents: diff changeset	556 perl \${DEFUSE_PATH}/scripts/defuse.pl -c $defuse_config -d data_dir -o output_dir -p 8
b75ea9927793 Uploaded jjohnson parents: diff changeset	557 ## copy primary results to output datasets
b75ea9927793 Uploaded jjohnson parents: diff changeset	558 if [ -e output_dir/log/defuse.log ]; then cp output_dir/log/defuse.log $defuse_log; fi
b75ea9927793 Uploaded jjohnson parents: diff changeset	559 if [ -e output_dir/results.tsv ]; then cp output_dir/results.tsv $results_tsv; fi
b75ea9927793 Uploaded jjohnson parents: diff changeset	560 if [ -e output_dir/results.filtered.tsv ]; then cp output_dir/results.filtered.tsv $results_filtered_tsv; fi
b75ea9927793 Uploaded jjohnson parents: diff changeset	561 if [ -e output_dir/results.classify.tsv ]; then cp output_dir/results.classify.tsv $results_classify_tsv; fi
b75ea9927793 Uploaded jjohnson parents: diff changeset	562 ## create html with links for output_dir
b75ea9927793 Uploaded jjohnson parents: diff changeset	563 #if $defuse_out.__str__ != 'None':
b75ea9927793 Uploaded jjohnson parents: diff changeset	564 if [ -e $defuse_out ]
b75ea9927793 Uploaded jjohnson parents: diff changeset	565 then
b75ea9927793 Uploaded jjohnson parents: diff changeset	566 echo '${lt}html${gt}${lt}head${gt}${lt}title${gt}Defuse Output${lt}/title${gt}${lt}/head${gt}${lt}body${gt}' ${gt} $defuse_out
b75ea9927793 Uploaded jjohnson parents: diff changeset	567 echo '${lt}h2${gt}Defuse Output Files${lt}/h2${gt}${lt}ul${gt}' ${gt}${gt} $defuse_out
b75ea9927793 Uploaded jjohnson parents: diff changeset	568 pushd $defuse_out.extra_files_path
b75ea9927793 Uploaded jjohnson parents: diff changeset	569 for f in `find -L . -maxdepth 1 -type f`;
b75ea9927793 Uploaded jjohnson parents: diff changeset	570 do fn=`basename ${ds}f`; echo '${lt}li${gt}${lt}a href="'${ds}fn'"${gt}'${ds}fn'${lt}/a${gt}${lt}/li${gt}' ${gt}${gt} $defuse_out;
b75ea9927793 Uploaded jjohnson parents: diff changeset	571 done
b75ea9927793 Uploaded jjohnson parents: diff changeset	572 popd
b75ea9927793 Uploaded jjohnson parents: diff changeset	573 echo '${lt}/ul${gt}' ${gt}${gt} $defuse_out
b75ea9927793 Uploaded jjohnson parents: diff changeset	574 echo '${lt}/body${gt}${lt}/html${gt}' ${gt}${gt} $defuse_out
b75ea9927793 Uploaded jjohnson parents: diff changeset	575 fi
b75ea9927793 Uploaded jjohnson parents: diff changeset	576 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	577 ## run get_reads.pl on each cluster
b75ea9927793 Uploaded jjohnson parents: diff changeset	578 #if $fusion_reads.__str__ != 'None':
b75ea9927793 Uploaded jjohnson parents: diff changeset	579 if [ -e output_dir/results.filtered.tsv -a -e $fusion_reads ]
b75ea9927793 Uploaded jjohnson parents: diff changeset	580 then
b75ea9927793 Uploaded jjohnson parents: diff changeset	581 mkdir -p $fusion_reads.extra_files_path
b75ea9927793 Uploaded jjohnson parents: diff changeset	582 results2html output_dir/results.filtered.tsv $fusion_reads $fusion_reads.extra_files_path
b75ea9927793 Uploaded jjohnson parents: diff changeset	583 fi
b75ea9927793 Uploaded jjohnson parents: diff changeset	584 #end if
b75ea9927793 Uploaded jjohnson parents: diff changeset	585 </configfile>
b75ea9927793 Uploaded jjohnson parents: diff changeset	586 </configfiles>
b75ea9927793 Uploaded jjohnson parents: diff changeset	587 <outputs>
b75ea9927793 Uploaded jjohnson parents: diff changeset	588 <data format="txt" name="config_txt" label="${tool.name} on ${on_string}: config.txt"/>
b75ea9927793 Uploaded jjohnson parents: diff changeset	589 <data format="txt" name="defuse_log" label="${tool.name} on ${on_string}: defuse.log" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	590 <data format="html" name="defuse_out" label="${tool.name} on ${on_string}: defuse_output">
b75ea9927793 Uploaded jjohnson parents: diff changeset	591 <filter>keep_output == True</filter>
b75ea9927793 Uploaded jjohnson parents: diff changeset	592 </data>
b75ea9927793 Uploaded jjohnson parents: diff changeset	593 <data format="html" name="fusion_reads" label="${tool.name} on ${on_string}: fusion_reads">
b75ea9927793 Uploaded jjohnson parents: diff changeset	594 <filter>do_get_reads == True</filter>
b75ea9927793 Uploaded jjohnson parents: diff changeset	595 </data>
b75ea9927793 Uploaded jjohnson parents: diff changeset	596 <data format="tabular" name="results_tsv" label="${tool.name} on ${on_string}: results.tsv" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	597 <data format="tabular" name="results_filtered_tsv" label="${tool.name} on ${on_string}: results.filtered.tsv" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	598 <data format="tabular" name="results_classify_tsv" label="${tool.name} on ${on_string}: results.classify.tsv" />
b75ea9927793 Uploaded jjohnson parents: diff changeset	599 </outputs>
b75ea9927793 Uploaded jjohnson parents: diff changeset	600 <tests>
b75ea9927793 Uploaded jjohnson parents: diff changeset	601 </tests>
b75ea9927793 Uploaded jjohnson parents: diff changeset	602 <help>
b75ea9927793 Uploaded jjohnson parents: diff changeset	603 DeFuse
b75ea9927793 Uploaded jjohnson parents: diff changeset	604
b75ea9927793 Uploaded jjohnson parents: diff changeset	605 DeFuse_ is a software package for gene fusion discovery using RNA-Seq data. The software uses clusters of discordant paired end alignments to inform a split read alignment analysis for finding fusion boundaries. The software also employs a number of heuristic filters in an attempt to reduce the number of false positives and produces a fully annotated output for each predicted fusion.
b75ea9927793 Uploaded jjohnson parents: diff changeset	606
b75ea9927793 Uploaded jjohnson parents: diff changeset	607 Journal reference: http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjournal.pcbi.1001138
b75ea9927793 Uploaded jjohnson parents: diff changeset	608
b75ea9927793 Uploaded jjohnson parents: diff changeset	609 .. _DeFuse: http://sourceforge.net/apps/mediawiki/defuse/index.php?title=Main_Page
b75ea9927793 Uploaded jjohnson parents: diff changeset	610
b75ea9927793 Uploaded jjohnson parents: diff changeset	611 ------
b75ea9927793 Uploaded jjohnson parents: diff changeset	612
b75ea9927793 Uploaded jjohnson parents: diff changeset	613 Inputs
b75ea9927793 Uploaded jjohnson parents: diff changeset	614
b75ea9927793 Uploaded jjohnson parents: diff changeset	615 DeFuse requires 2 fastq files for paried reads, one with the left mate of the paired reads, and a second fastq with the the right mate of the paired reads (with reads in the same order as in the first fastq dataset).
b75ea9927793 Uploaded jjohnson parents: diff changeset	616
b75ea9927793 Uploaded jjohnson parents: diff changeset	617 If your fastq files have reads in different orders or include unpaired reads, you can preprocess them with FASTQ interlacer to create a single interlaced fastq dataset with only the paired reads and input that to FASTQ de-interlacer to separate the reads into a left fastq and right fastq.
b75ea9927793 Uploaded jjohnson parents: diff changeset	618
b75ea9927793 Uploaded jjohnson parents: diff changeset	619 DeFuse uses a Reference Dataset to search for gene fusions. The Reference Dataset is generated from the following sources in DeFuse_Version_0.4_:
b75ea9927793 Uploaded jjohnson parents: diff changeset	620 - genome_fasta from Ensembl
b75ea9927793 Uploaded jjohnson parents: diff changeset	621 - gene_models from Ensembl
b75ea9927793 Uploaded jjohnson parents: diff changeset	622 - repeats_filename from UCSC RepeatMasker rmsk.txt
b75ea9927793 Uploaded jjohnson parents: diff changeset	623 - est_fasta from UCSC
b75ea9927793 Uploaded jjohnson parents: diff changeset	624 - est_alignments from UCSC intronEst.txt
b75ea9927793 Uploaded jjohnson parents: diff changeset	625 - unigene_fasta from NCBI
b75ea9927793 Uploaded jjohnson parents: diff changeset	626
b75ea9927793 Uploaded jjohnson parents: diff changeset	627 .. _DeFuse_Version_0.4: http://sourceforge.net/apps/mediawiki/defuse/index.php?title=DeFuse_Version_0.4.2
b75ea9927793 Uploaded jjohnson parents: diff changeset	628
b75ea9927793 Uploaded jjohnson parents: diff changeset	629 ------
b75ea9927793 Uploaded jjohnson parents: diff changeset	630
b75ea9927793 Uploaded jjohnson parents: diff changeset	631 Outputs
b75ea9927793 Uploaded jjohnson parents: diff changeset	632
b75ea9927793 Uploaded jjohnson parents: diff changeset	633 The galaxy history will contain 5 outputs: the config.txt file that provides DeFuse with its parameters, the defuse.log which details what DeFuse has done and can be useful in determining any errors, and the 3 results files that defuse generates.
b75ea9927793 Uploaded jjohnson parents: diff changeset	634
b75ea9927793 Uploaded jjohnson parents: diff changeset	635 DeFuse generates 3 results files: results.txt, results.filtered.txt, and results.classify.txt. All three files have the same format, though results.classify.txt has a probability column from the application of the classifier to results.txt, and results.filtered.txt has been filtered according to the threshold probability as set in config.txt.
b75ea9927793 Uploaded jjohnson parents: diff changeset	636
b75ea9927793 Uploaded jjohnson parents: diff changeset	637 The file format is tab delimited with one prediction per line, and the following fields per prediction (not necessarily in this order):
b75ea9927793 Uploaded jjohnson parents: diff changeset	638
b75ea9927793 Uploaded jjohnson parents: diff changeset	639 - Identification
b75ea9927793 Uploaded jjohnson parents: diff changeset	640 - cluster_id : random identifier assigned to each prediction
b75ea9927793 Uploaded jjohnson parents: diff changeset	641 - library_name : library name given on the command line of defuse
b75ea9927793 Uploaded jjohnson parents: diff changeset	642 - gene1 : ensembl id of gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	643 - gene2 : ensembl id of gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	644 - gene_name1 : name of gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	645 - gene_name2 : name of gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	646 - Evidence
b75ea9927793 Uploaded jjohnson parents: diff changeset	647 - break_predict : breakpoint prediction method, denovo or splitr, that is considered most reliable
b75ea9927793 Uploaded jjohnson parents: diff changeset	648 - concordant_ratio : proportion of spanning reads considered concordant by blat
b75ea9927793 Uploaded jjohnson parents: diff changeset	649 - denovo_min_count : minimum kmer count across denovo assembled sequence
b75ea9927793 Uploaded jjohnson parents: diff changeset	650 - denovo_sequence : fusion sequence predicted by debruijn based denovo sequence assembly
b75ea9927793 Uploaded jjohnson parents: diff changeset	651 - denovo_span_pvalue : p-value, lower values are evidence the prediction is a false positive
b75ea9927793 Uploaded jjohnson parents: diff changeset	652 - gene_align_strand1 : alignment strand for spanning read alignments to gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	653 - gene_align_strand2 : alignment strand for spanning read alignments to gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	654 - min_map_count : minimum of the number of genomic mappings for each spanning read
b75ea9927793 Uploaded jjohnson parents: diff changeset	655 - max_map_count : maximum of the number of genomic mappings for each spanning read
b75ea9927793 Uploaded jjohnson parents: diff changeset	656 - mean_map_count : average of the number of genomic mappings for each spanning read
b75ea9927793 Uploaded jjohnson parents: diff changeset	657 - num_multi_map : number of spanning reads that map to more than one genomic location
b75ea9927793 Uploaded jjohnson parents: diff changeset	658 - span_count : number of spanning reads supporting the fusion
b75ea9927793 Uploaded jjohnson parents: diff changeset	659 - span_coverage1 : coverage of spanning reads aligned to gene 1 as a proportion of expected coverage
b75ea9927793 Uploaded jjohnson parents: diff changeset	660 - span_coverage2 : coverage of spanning reads aligned to gene 2 as a proportion of expected coverage
b75ea9927793 Uploaded jjohnson parents: diff changeset	661 - span_coverage_min : minimum of span_coverage1 and span_coverage2
b75ea9927793 Uploaded jjohnson parents: diff changeset	662 - span_coverage_max : maximum of span_coverage1 and span_coverage2
b75ea9927793 Uploaded jjohnson parents: diff changeset	663 - splitr_count : number of split reads supporting the prediction
b75ea9927793 Uploaded jjohnson parents: diff changeset	664 - splitr_min_pvalue : p-value, lower values are evidence the prediction is a false positive
b75ea9927793 Uploaded jjohnson parents: diff changeset	665 - splitr_pos_pvalue : p-value, lower values are evidence the prediction is a false positive
b75ea9927793 Uploaded jjohnson parents: diff changeset	666 - splitr_sequence : fusion sequence predicted by split reads
b75ea9927793 Uploaded jjohnson parents: diff changeset	667 - splitr_span_pvalue : p-value, lower values are evidence the prediction is a false positive
b75ea9927793 Uploaded jjohnson parents: diff changeset	668 - Annotation
b75ea9927793 Uploaded jjohnson parents: diff changeset	669 - adjacent : fusion between adjacent genes
b75ea9927793 Uploaded jjohnson parents: diff changeset	670 - altsplice : fusion likely the product of alternative splicing between adjacent genes
b75ea9927793 Uploaded jjohnson parents: diff changeset	671 - break_adj_entropy1 : di-nucleotide entropy of the 40 nucleotides adjacent to the fusion splice in gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	672 - break_adj_entropy2 : di-nucleotide entropy of the 40 nucleotides adjacent to the fusion splice in gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	673 - break_adj_entropy_min : minimum of break_adj_entropy1 and break_adj_entropy2
b75ea9927793 Uploaded jjohnson parents: diff changeset	674 - breakpoint_homology : number of nucleotides at the fusion splice that align equally well to gene 1 or gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	675 - breakseqs_estislands_percident : maximum percent identity of fusion sequence alignments to est islands
b75ea9927793 Uploaded jjohnson parents: diff changeset	676 - cdna_breakseqs_percident : maximum percent identity of fusion sequence alignments to cdna
b75ea9927793 Uploaded jjohnson parents: diff changeset	677 - deletion : fusion produced by a genomic deletion
b75ea9927793 Uploaded jjohnson parents: diff changeset	678 - est_breakseqs_percident : maximum percent identity of fusion sequence alignments to est
b75ea9927793 Uploaded jjohnson parents: diff changeset	679 - eversion : fusion produced by a genomic eversion
b75ea9927793 Uploaded jjohnson parents: diff changeset	680 - exonboundaries : fusion splice at exon boundaries
b75ea9927793 Uploaded jjohnson parents: diff changeset	681 - expression1 : expression of gene 1 as number of concordant pairs aligned to exons
b75ea9927793 Uploaded jjohnson parents: diff changeset	682 - expression2 : expression of gene 2 as number of concordant pairs aligned to exons
b75ea9927793 Uploaded jjohnson parents: diff changeset	683 - gene_chromosome1 : chromosome of gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	684 - gene_chromosome2 : chromosome of gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	685 - gene_end1 : end position for gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	686 - gene_end2 : end position for gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	687 - gene_location1 : location of breakpoint in gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	688 - gene_location2 : location of breakpoint in gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	689 - gene_start1 : start of gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	690 - gene_start2 : start of gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	691 - gene_strand1 : strand of gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	692 - gene_strand2 : strand of gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	693 - genome_breakseqs_percident : maximum percent identity of fusion sequence alignments to genome
b75ea9927793 Uploaded jjohnson parents: diff changeset	694 - genomic_break_pos1 : genomic position in gene 1 of fusion splice / breakpoint
b75ea9927793 Uploaded jjohnson parents: diff changeset	695 - genomic_break_pos2 : genomic position in gene 2 of fusion splice / breakpoint
b75ea9927793 Uploaded jjohnson parents: diff changeset	696 - genomic_strand1 : genomic strand in gene 1 of fusion splice / breakpoint, retained sequence upstream on this strand, breakpoint is downstream
b75ea9927793 Uploaded jjohnson parents: diff changeset	697 - genomic_strand2 : genomic strand in gene 2 of fusion splice / breakpoint, retained sequence upstream on this strand, breakpoint is downstream
b75ea9927793 Uploaded jjohnson parents: diff changeset	698 - interchromosomal : fusion produced by an interchromosomal translocation
b75ea9927793 Uploaded jjohnson parents: diff changeset	699 - interrupted_index1 : ratio of coverage before and after the fusion splice / breakpoint in gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	700 - interrupted_index2 : ratio of coverage before and after the fusion splice / breakpoint in gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	701 - inversion : fusion produced by genomic inversion
b75ea9927793 Uploaded jjohnson parents: diff changeset	702 - orf : fusion combines genes in a way that preserves a reading frame
b75ea9927793 Uploaded jjohnson parents: diff changeset	703 - probability : probability produced by classification using adaboost and example positives/negatives (only given in results.classified.txt)
b75ea9927793 Uploaded jjohnson parents: diff changeset	704 - read_through : fusion involving adjacent potentially resulting from co-transcription rather than genome rearrangement
b75ea9927793 Uploaded jjohnson parents: diff changeset	705 - repeat_proportion1 : proportion of the spanning reads in gene 1 that span a repeat region
b75ea9927793 Uploaded jjohnson parents: diff changeset	706 - repeat_proportion2 : proportion of the spanning reads in gene 2 that span a repeat region
b75ea9927793 Uploaded jjohnson parents: diff changeset	707 - max_repeat_proportion : max of repeat_proportion1 and repeat_proportion2
b75ea9927793 Uploaded jjohnson parents: diff changeset	708 - splice_score : number of nucleotides similar to GTAG at fusion splice
b75ea9927793 Uploaded jjohnson parents: diff changeset	709 - num_splice_variants : number of potential splice variants for this gene pair
b75ea9927793 Uploaded jjohnson parents: diff changeset	710 - splicing_index1 : number of concordant pairs in gene 1 spanning the fusion splice / breakpoint, divided by number of spanning reads supporting the fusion with gene 2
b75ea9927793 Uploaded jjohnson parents: diff changeset	711 - splicing_index2 : number of concordant pairs in gene 2 spanning the fusion splice / breakpoint, divided by number of spanning reads supporting the fusion with gene 1
b75ea9927793 Uploaded jjohnson parents: diff changeset	712
b75ea9927793 Uploaded jjohnson parents: diff changeset	713
b75ea9927793 Uploaded jjohnson parents: diff changeset	714 Example
b75ea9927793 Uploaded jjohnson parents: diff changeset	715
b75ea9927793 Uploaded jjohnson parents: diff changeset	716 results.tsv::
b75ea9927793 Uploaded jjohnson parents: diff changeset	717
b75ea9927793 Uploaded jjohnson parents: diff changeset	718 cluster_id splitr_sequence splitr_count splitr_span_pvalue splitr_pos_pvalue splitr_min_pvalue adjacent altsplice break_adj_entropy1 break_adj_entropy2 break_adj_entropy_min break_predict breakpoint_homology breakseqs_estislands_percident cdna_breakseqs_percident concordant_ratio deletion est_breakseqs_percident eversion exonboundaries expression1 expression2 gene1 gene2 gene_align_strand1 gene_align_strand2 gene_chromosome1 gene_chromosome2 gene_end1 gene_end2 gene_location1 gene_location2 gene_name1 gene_name2 gene_start1 gene_start2 gene_strand1 gene_strand2 genome_breakseqs_percident genomic_break_pos1 genomic_break_pos2 genomic_strand1 genomic_strand2 interchromosomal interrupted_index1 interrupted_index2 inversion library_name max_map_count max_repeat_proportion mean_map_count min_map_count num_multi_map num_splice_variants orf read_through repeat_proportion1 repeat_proportion2 span_count span_coverage1 span_coverage2 span_coverage_max span_coverage_min splice_score splicing_index1 splicing_index2
b75ea9927793 Uploaded jjohnson parents: diff changeset	719 1169 GCTTACTGTATGCCAGGCCCCAGAGGGGCAACCACCCTCTAAAGAGAGCGGCTCCTGCCTCCCAGAAAGCTCACAGACTGTGGGAGGGAAACAGGCAGCAGGTGAAGATGCCAAATGCCAGGATATCTGCCCTGTCCTTGCTTGATGCAGCTGCTGGCTCCCACGTTCTCCCCAGAATCCCCTCACACTCCTGCTGTTTTCTCTGCAGGTTGGCAGAGCCCCATGAGGGCAGGGCAGCCACTTTGTTCTTGGGCGGCAAACCTCCCTGGGCGGCACGGAAACCACGGTGAGAAGGGGGCAGGTCGGGCACGTGCAGGGACCACGCTGCAGG\|TGTACCCAACAGCTCCGAAGAGACAGCGACCATCGAGAACGGGCCATGATGACGATGGCGGTTTTGTCGAAAAGAAAAGGGGGAAATGTGGGGAAAAGCAAGAGAGATCAGATTGTTACTGTGTCTGTGTAGAAAGAAGTAGACATGGGAGACTCCATTTTGTTCTGTACTAAGAAAAATTCTTCTGCCTTGAGATTCGGTGACCCCACCCCCAACCCCGTGCTCTCTGAAACATGTGCTGTGTCCACTCAGGGTTGAATGGATTAAGGGCGGTGCGAGACGTGCTTT 2 0.000436307890680442 0.110748295953850 0.0880671602973091 N Y 3.19872427442695 3.48337348351473 3.19872427442695 splitr 0 0 0 0 Y 0 N N 0 0 ENSG00000105549 ENSG00000213753 + - 19 19 376013 59111168 intron upstream THEG AC016629.2 361750 59084870 - + 0 375099 386594 + - N 8.34107429512245 - N output_dir 82 0.677852348993289 40.6666666666667 1 11 1 N N 0.361271676300578 0.677852348993289 12 0.758602776578432 0.569678713445872 0.758602776578432 0.569678713445872 2 0.416666666666667 -
b75ea9927793 Uploaded jjohnson parents: diff changeset	720 3596 TGGGGGTTGAGGCTTCTGTTCCCAGGTTCCATGACCTCAGAGGTGGCTGGTGAGGTTATGACCTTTGCCCTCCAGCCCTGGCTTAAAACCTCAGCCCTAGGACCTGGTTAAAGGAAGGGGAGATGGAGCTTTGCCCCGACCCCCCCCCGTTCCCCTCACCTGTCAGCCCGAGCTGGGCCAGGGCCCCTAGGTGGGGAACTGGGCCGGGGGGCGGGCACAAGCGGAGGTGGTGCCCCCAAAAGGGCTCCCGGTGGGGTCTTGCTGAGAAGGTGAGGGGTTCCCGGGGCCGCAGCAGGTGGTGGTGGAGGAGCCAAGCGGCTGTAGAGCAAGGGGTGAGCAGGTTCCAGACCGTAGAGGCGGGCAGCGGCCACGGCCCCGGGTCCAGTTAGCTCCTCACCCGCCTCATAGAAGCGGGGTGGCCTTGCCAGGCGTGGGGGTGCTGCC\|TTCCTTGGATGTGGTAGCCGTTTCTCAGGCTCCCTCTCCGGAATCGAACCCTGATTCCCCGTCACCCGTGGTCACCATGGTAGGCACGGCGACTACCATCGAAAGTTGATAGGGCAGACGTTCGAATGGGTCGTCGCCGCCACGGGGGGCGTGCGATCAGCCCGAGGTTATCTAGAGTCACCAAAGCCGCCGGCGCCCGCCCCCCGGCCGGGGCCGGAGAGGGGCTGACCGGGTTGGTTTTGATCTGATAAATGCACGCATCCCCCCCGCGAAGGGGGTCAGCGCCCGTCGGCATGTATTAGCTCTAGAATTACCACAGTTATCCAAGTAGGAGAGGAGCGAGCGACCAAAGGAACCATAACTGATTTAATGAGCCATTCGCAGTTTCACTGTACCGGCCGTGCGTACTTAGACATGCATGGCTTAATCTTTGAGACAAGCATATGCTACTGGCAGG 250 7.00711162298275e-72 0.00912124762512338 0.00684237452309549 N N 3.31745197152461 3.47233119514066 3.31745197152461 splitr 7 0.0157657657657656 0 0 N 0.0135135135135136 N N 0 0 ENSG00000156860 ENSG00000212932 - + 16 21 30682131 48111157 coding upstream FBRS RPL23AP4 30670289 48110676 + + 0.0157657657657656 30680678 9827473 - + Y - - N output_dir 2 1 1.11111111111111 1 1 1 N N 0 1 9 0.325530693397641 0.296465452915709 0.325530693397641 0.296465452915709 2 - -
b75ea9927793 Uploaded jjohnson parents: diff changeset	721
b75ea9927793 Uploaded jjohnson parents: diff changeset	722 </help>
b75ea9927793 Uploaded jjohnson parents: diff changeset	723 </tool>

Mercurial > repos > jjohnson > defuse

annotate defuse.xml @ 1:6ee9d8b45113