pear: pear.xml annotate

annotate pear.xml @ 0:b0e3a2df7897 draft

Uploaded

author	iuc
date	Wed, 11 Feb 2015 07:52:43 -0500
parents
children	361d2cb38860

rev	line source
0 b0e3a2df7897 Uploaded iuc parents: diff changeset	1 <tool id="iuc_pear" name="Pear" version="0.9.6.0">
b0e3a2df7897 Uploaded iuc parents: diff changeset	2 <description>Paired-End read merger</description>
b0e3a2df7897 Uploaded iuc parents: diff changeset	3 <!--<version_command>bismark version</version_command>-->
b0e3a2df7897 Uploaded iuc parents: diff changeset	4 <requirements>
b0e3a2df7897 Uploaded iuc parents: diff changeset	5 <requirement type="package" version="0.9.6">pear</requirement>
b0e3a2df7897 Uploaded iuc parents: diff changeset	6 </requirements>
b0e3a2df7897 Uploaded iuc parents: diff changeset	7 <stdio>
b0e3a2df7897 Uploaded iuc parents: diff changeset	8 <exit_code range="1:" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	9 <exit_code range=":-1" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	10 <regex match="Error:" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	11 <regex match="Exception:" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	12 </stdio>
b0e3a2df7897 Uploaded iuc parents: diff changeset	13 <command>
b0e3a2df7897 Uploaded iuc parents: diff changeset	14 <![CDATA[
b0e3a2df7897 Uploaded iuc parents: diff changeset	15 pear
b0e3a2df7897 Uploaded iuc parents: diff changeset	16 -f $forward
b0e3a2df7897 Uploaded iuc parents: diff changeset	17 -r $reverse
b0e3a2df7897 Uploaded iuc parents: diff changeset	18 --output pear
b0e3a2df7897 Uploaded iuc parents: diff changeset	19 --p-value $pvalue
b0e3a2df7897 Uploaded iuc parents: diff changeset	20 --min-overlap $min_overlap
b0e3a2df7897 Uploaded iuc parents: diff changeset	21 #if int($max_assembly_length) > 0:
b0e3a2df7897 Uploaded iuc parents: diff changeset	22 --max-asm-length $max_assembly_length
b0e3a2df7897 Uploaded iuc parents: diff changeset	23 #end if
b0e3a2df7897 Uploaded iuc parents: diff changeset	24 --min-asm-length $min_assembly_length
b0e3a2df7897 Uploaded iuc parents: diff changeset	25 --min-trim-length $min_trim_length
b0e3a2df7897 Uploaded iuc parents: diff changeset	26 --quality-theshold $quality_threshold
b0e3a2df7897 Uploaded iuc parents: diff changeset	27 --max-uncalled-base $max_uncalled_base
b0e3a2df7897 Uploaded iuc parents: diff changeset	28 --test-method $test_method
b0e3a2df7897 Uploaded iuc parents: diff changeset	29 --empirical-freqs $empirical_freqs
b0e3a2df7897 Uploaded iuc parents: diff changeset	30 -j "\${GALAXY_SLOTS:-8}"
b0e3a2df7897 Uploaded iuc parents: diff changeset	31 --score-method $score_method
b0e3a2df7897 Uploaded iuc parents: diff changeset	32 --cap $cap
b0e3a2df7897 Uploaded iuc parents: diff changeset	33 $nbase
b0e3a2df7897 Uploaded iuc parents: diff changeset	34 ]]>
b0e3a2df7897 Uploaded iuc parents: diff changeset	35 </command>
b0e3a2df7897 Uploaded iuc parents: diff changeset	36 <inputs>
b0e3a2df7897 Uploaded iuc parents: diff changeset	37 <param name="forward" type="data" format="fastqillumina, fastqsanger, fastq"
b0e3a2df7897 Uploaded iuc parents: diff changeset	38 label="Specify the name of file that contains the forward paired-end reads" help="-f" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	39 <param name="reverse" type="data" format="fastqillumina, fastqsanger, fastq"
b0e3a2df7897 Uploaded iuc parents: diff changeset	40 label="Specify the name of file that contains the reverse paired-end reads" help="-r" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	41
b0e3a2df7897 Uploaded iuc parents: diff changeset	42 <!-- optional -->
b0e3a2df7897 Uploaded iuc parents: diff changeset	43 <param name="pvalue" type="float" value="0.01" min="0" optional="True" max="1" label="Specify a p-value for the statistical test"
b0e3a2df7897 Uploaded iuc parents: diff changeset	44 help="If the computed p-value of a possible assembly exceeds the specified p-value then the paired-end read will not be assembled. Setting 1.0 disables the test. (--p-value)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	45
b0e3a2df7897 Uploaded iuc parents: diff changeset	46 <param name="min_overlap" type="integer" value="10" optional="True" label="Specify the minimum overlap size"
b0e3a2df7897 Uploaded iuc parents: diff changeset	47 help="The minimum overlap may be set to 1 when the statistical test is used. However, further restricting the minimum overlap size to a proper value may reduce false-positive assembles. (--min-overlap)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	48
b0e3a2df7897 Uploaded iuc parents: diff changeset	49 <param name="max_assembly_length" type="integer" value="0" optional="True" label="Specify the maximum possible length of the assembled sequences"
b0e3a2df7897 Uploaded iuc parents: diff changeset	50 help="Setting this value to 0 disables the restriction and assembled sequences may be arbitrary long. (--max-assembly-length)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	51
b0e3a2df7897 Uploaded iuc parents: diff changeset	52 <param name="min_assembly_length" type="integer" value="50" optional="True" label="Specify the minimum possible length of the assembled sequences"
b0e3a2df7897 Uploaded iuc parents: diff changeset	53 help="Setting this value to 0 disables the restriction and assembled sequences may be arbitrary short. (--min-assembly-length)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	54
b0e3a2df7897 Uploaded iuc parents: diff changeset	55 <param name="min_trim_length" type="integer" value="1" optional="True" label="Specify the minimum length of reads after trimming the low quality part"
b0e3a2df7897 Uploaded iuc parents: diff changeset	56 help="See option -q. (--min-trim-length)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	57
b0e3a2df7897 Uploaded iuc parents: diff changeset	58 <param name="quality_threshold" type="integer" value="0" optional="True" label="Specify the quality score threshold for trimming the low quality part of a read"
b0e3a2df7897 Uploaded iuc parents: diff changeset	59 help="If the quality scores of two consecutive bases are strictly less than the specified threshold, the rest of the read will be trimmed. (--quality-threshold)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	60
b0e3a2df7897 Uploaded iuc parents: diff changeset	61 <param name="max_uncalled_base" type="float" value="1.0" min="0" optional="True" max="1" label="Specify the maximal proportion of uncalled bases in a read"
b0e3a2df7897 Uploaded iuc parents: diff changeset	62 help="Setting this value to 0 will cause PEAR to discard all reads containing uncalled bases. The other extreme setting is 1 which causes PEAR to process all reads independent on the number of uncalled bases. (--max-uncalled-base)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	63
b0e3a2df7897 Uploaded iuc parents: diff changeset	64 <param name="cap" type="integer" value="40" optional="True" label="Specify the upper bound for the resulting quality score"
b0e3a2df7897 Uploaded iuc parents: diff changeset	65 help="If set to zero, capping is disabled. (--cap)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	66
b0e3a2df7897 Uploaded iuc parents: diff changeset	67 <param name="test_method" type="select" label="Specify the type of statistical test" help="(--test-method)">
b0e3a2df7897 Uploaded iuc parents: diff changeset	68 <option value="1" selected="True">Given the minimum allowed overlap, test using the highest OES (1)</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	69 <option value="2">Use the acceptance probability (2)</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	70 </param>
b0e3a2df7897 Uploaded iuc parents: diff changeset	71
b0e3a2df7897 Uploaded iuc parents: diff changeset	72 <param name="empirical_freqs" type="boolean" truevalue="-e" falsevalue="" checked="false"
b0e3a2df7897 Uploaded iuc parents: diff changeset	73 label="Disable empirical base frequencies" help="(--empirical-freqs)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	74 <param name="nbase" type="boolean" truevalue="--nbase" falsevalue="" checked="false"
b0e3a2df7897 Uploaded iuc parents: diff changeset	75 label="Use N base if uncertain" help="When merging a base-pair that consists of two non-equal bases out of which none is degenerate, set the merged base to N and use the highest quality score of the two bases. (--nbase)" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	76
b0e3a2df7897 Uploaded iuc parents: diff changeset	77 <param name="score_method" type="select" label="Specify the scoring method" help="(--score-method)">
b0e3a2df7897 Uploaded iuc parents: diff changeset	78 <option value="1">OES with +1 for match and -1 for mismatch</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	79 <option value="2" selected="True">Assembly score (AS) use +1 for match and -1 for mismatch multiplied by base quality scores</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	80 <option value="3">Ignore quality scores and use +1 for a match and -1 for a mismatch</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	81 </param>
b0e3a2df7897 Uploaded iuc parents: diff changeset	82
b0e3a2df7897 Uploaded iuc parents: diff changeset	83 <param name="outputs" type="select" display="checkboxes" multiple="True" label="Output files">
b0e3a2df7897 Uploaded iuc parents: diff changeset	84 <option value="assembled" selected="True">Assembled reads</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	85 <option value="forward">Forward unassembled reads</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	86 <option value="reverse">Reverse unassembled reads</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	87 <option value="discarded">Discarded reads</option>
b0e3a2df7897 Uploaded iuc parents: diff changeset	88
b0e3a2df7897 Uploaded iuc parents: diff changeset	89 <validator type="no_options" message="Please select at least one output file." />
b0e3a2df7897 Uploaded iuc parents: diff changeset	90 </param>
b0e3a2df7897 Uploaded iuc parents: diff changeset	91 </inputs>
b0e3a2df7897 Uploaded iuc parents: diff changeset	92 <outputs>
b0e3a2df7897 Uploaded iuc parents: diff changeset	93 <data format="fastq" name="assembled_reads" from_work_dir="pear.assembled.fastq" label="${tool.name} on ${on_string}: Assembled reads">
b0e3a2df7897 Uploaded iuc parents: diff changeset	94 <filter>'assembled' in outputs</filter>
b0e3a2df7897 Uploaded iuc parents: diff changeset	95 </data>
b0e3a2df7897 Uploaded iuc parents: diff changeset	96 <data format="fastq" name="unassembled_forward_reads" from_work_dir="pear.unassembled.forward.fastq" label="${tool.name} on ${on_string}: Unassembled forward reads">
b0e3a2df7897 Uploaded iuc parents: diff changeset	97 <filter>'forward' in outputs</filter>
b0e3a2df7897 Uploaded iuc parents: diff changeset	98 </data>
b0e3a2df7897 Uploaded iuc parents: diff changeset	99 <data format="fastq" name="unassembled_reverse_reads" from_work_dir="pear.unassembled.reverse.fastq" label="${tool.name} on ${on_string}: Unassembled reverse reads">
b0e3a2df7897 Uploaded iuc parents: diff changeset	100 <filter>'reverse' in outputs</filter>
b0e3a2df7897 Uploaded iuc parents: diff changeset	101 </data>
b0e3a2df7897 Uploaded iuc parents: diff changeset	102 <data format="fastq" name="discarded_reads" from_work_dir="pear.discarded.fastq" label="${tool.name} on ${on_string}: Discarded reads">
b0e3a2df7897 Uploaded iuc parents: diff changeset	103 <filter>'discarded' in outputs</filter>
b0e3a2df7897 Uploaded iuc parents: diff changeset	104 </data>
b0e3a2df7897 Uploaded iuc parents: diff changeset	105 </outputs>
b0e3a2df7897 Uploaded iuc parents: diff changeset	106 <tests>
b0e3a2df7897 Uploaded iuc parents: diff changeset	107 <test>
b0e3a2df7897 Uploaded iuc parents: diff changeset	108 <param name="forward" value="forward.fastq" ftype="fastq" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	109 <param name="reverse" value="reverse.fastq" ftype="fastq" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	110 <param name="min_overlap" value="10" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	111 <param name="min_assembly_length" value="50" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	112 <param name="cap" value="0" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	113 <param name="outputs" value="assembled,forward" />
b0e3a2df7897 Uploaded iuc parents: diff changeset	114 <output name="assembled_reads" file="pear_assembled_results1.fastq" ftype="fastq"/>
b0e3a2df7897 Uploaded iuc parents: diff changeset	115 <output name="unassembled_forward_reads" file="pear_unassembled_forward_results1.fastq" ftype="fastq"/>
b0e3a2df7897 Uploaded iuc parents: diff changeset	116 </test>
b0e3a2df7897 Uploaded iuc parents: diff changeset	117 </tests>
b0e3a2df7897 Uploaded iuc parents: diff changeset	118 <help>
b0e3a2df7897 Uploaded iuc parents: diff changeset	119 <![CDATA[
b0e3a2df7897 Uploaded iuc parents: diff changeset	120
b0e3a2df7897 Uploaded iuc parents: diff changeset	121 What it does
b0e3a2df7897 Uploaded iuc parents: diff changeset	122
b0e3a2df7897 Uploaded iuc parents: diff changeset	123 PEAR is an ultrafast, memory-efficient and highly accurate pair-end read merger.
b0e3a2df7897 Uploaded iuc parents: diff changeset	124 It is fully parallelized and can run with as low as just a few kilobytes of memory.
b0e3a2df7897 Uploaded iuc parents: diff changeset	125
b0e3a2df7897 Uploaded iuc parents: diff changeset	126
b0e3a2df7897 Uploaded iuc parents: diff changeset	127 Parameters
b0e3a2df7897 Uploaded iuc parents: diff changeset	128
b0e3a2df7897 Uploaded iuc parents: diff changeset	129
b0e3a2df7897 Uploaded iuc parents: diff changeset	130 Standard (mandatory):
b0e3a2df7897 Uploaded iuc parents: diff changeset	131 -f, --forward-fastq <str> Forward paired-end FASTQ file.
b0e3a2df7897 Uploaded iuc parents: diff changeset	132 -r, --reverse-fastq <str> Reverse paired-end FASTQ file.
b0e3a2df7897 Uploaded iuc parents: diff changeset	133
b0e3a2df7897 Uploaded iuc parents: diff changeset	134 Optional:
b0e3a2df7897 Uploaded iuc parents: diff changeset	135 -p, --p-value <float> Specify a p-value for the statistical test. If the computed
b0e3a2df7897 Uploaded iuc parents: diff changeset	136 p-value of a possible assembly exceeds the specified p-value
b0e3a2df7897 Uploaded iuc parents: diff changeset	137 then paired-end read will not be assembled. Valid options
b0e3a2df7897 Uploaded iuc parents: diff changeset	138 are: 0.0001, 0.001, 0.01, 0.05 and 1.0. Setting 1.0 disables
b0e3a2df7897 Uploaded iuc parents: diff changeset	139 the test. (default: 0.01)
b0e3a2df7897 Uploaded iuc parents: diff changeset	140 -v, --min-overlap <int> Specify the minimum overlap size. The minimum overlap may be
b0e3a2df7897 Uploaded iuc parents: diff changeset	141 set to 1 when the statistical test is used. However, further
b0e3a2df7897 Uploaded iuc parents: diff changeset	142 restricting the minimum overlap size to a proper value may
b0e3a2df7897 Uploaded iuc parents: diff changeset	143 reduce false-positive assembles. (default: 10)
b0e3a2df7897 Uploaded iuc parents: diff changeset	144 -m, --max-assembly-length <int> Specify the maximum possible length of the assembled
b0e3a2df7897 Uploaded iuc parents: diff changeset	145 sequences. Setting this value to 0 disables the restriction
b0e3a2df7897 Uploaded iuc parents: diff changeset	146 and assembled sequences may be arbitrary long. (default: 0)
b0e3a2df7897 Uploaded iuc parents: diff changeset	147 -n, --min-assembly-length <int> Specify the minimum possible length of the assembled
b0e3a2df7897 Uploaded iuc parents: diff changeset	148 sequences. Setting this value to 0 disables the restriction
b0e3a2df7897 Uploaded iuc parents: diff changeset	149 and assembled sequences may be arbitrary short. (default:
b0e3a2df7897 Uploaded iuc parents: diff changeset	150 50)
b0e3a2df7897 Uploaded iuc parents: diff changeset	151 -t, --min-trim-length <int> Specify the minimum length of reads after trimming the low
b0e3a2df7897 Uploaded iuc parents: diff changeset	152 quality part (see option -q). (default: 1)
b0e3a2df7897 Uploaded iuc parents: diff changeset	153 -q, --quality-threshold <int> Specify the quality score threshold for trimming the low
b0e3a2df7897 Uploaded iuc parents: diff changeset	154 quality part of a read. If the quality scores of two
b0e3a2df7897 Uploaded iuc parents: diff changeset	155 consecutive bases are strictly less than the specified
b0e3a2df7897 Uploaded iuc parents: diff changeset	156 threshold, the rest of the read will be trimmed. (default:
b0e3a2df7897 Uploaded iuc parents: diff changeset	157 0)
b0e3a2df7897 Uploaded iuc parents: diff changeset	158 -u, --max-uncalled-base <float> Specify the maximal proportion of uncalled bases in a read.
b0e3a2df7897 Uploaded iuc parents: diff changeset	159 Setting this value to 0 will cause PEAR to discard all reads
b0e3a2df7897 Uploaded iuc parents: diff changeset	160 containing uncalled bases. The other extreme setting is 1
b0e3a2df7897 Uploaded iuc parents: diff changeset	161 which causes PEAR to process all reads independent on the
b0e3a2df7897 Uploaded iuc parents: diff changeset	162 number of uncalled bases. (default: 1)
b0e3a2df7897 Uploaded iuc parents: diff changeset	163 -g, --test-method <int> Specify the type of statistical test. Two options are
b0e3a2df7897 Uploaded iuc parents: diff changeset	164 available. (default: 1)
b0e3a2df7897 Uploaded iuc parents: diff changeset	165 1: Given the minimum allowed overlap, test using the highest
b0e3a2df7897 Uploaded iuc parents: diff changeset	166 OES. Note that due to its discrete nature, this test usually
b0e3a2df7897 Uploaded iuc parents: diff changeset	167 yields a lower p-value for the assembled read than the cut-
b0e3a2df7897 Uploaded iuc parents: diff changeset	168 off (specified by -p). For example, setting the cut-off to
b0e3a2df7897 Uploaded iuc parents: diff changeset	169 0.05 using this test, the assembled reads might have an
b0e3a2df7897 Uploaded iuc parents: diff changeset	170 actual p-value of 0.02.
b0e3a2df7897 Uploaded iuc parents: diff changeset	171
b0e3a2df7897 Uploaded iuc parents: diff changeset	172 2. Use the acceptance probability (m.a.p). This test methods
b0e3a2df7897 Uploaded iuc parents: diff changeset	173 computes the same probability as test method 1. However, it
b0e3a2df7897 Uploaded iuc parents: diff changeset	174 assumes that the minimal overlap is the observed overlap
b0e3a2df7897 Uploaded iuc parents: diff changeset	175 with the highest OES, instead of the one specified by -v.
b0e3a2df7897 Uploaded iuc parents: diff changeset	176 Therefore, this is not a valid statistical test and the
b0e3a2df7897 Uploaded iuc parents: diff changeset	177 'p-value' is in fact the maximal probability for accepting
b0e3a2df7897 Uploaded iuc parents: diff changeset	178 the assembly. Nevertheless, we observed in practice that for
b0e3a2df7897 Uploaded iuc parents: diff changeset	179 the case the actual overlap sizes are relatively small, test
b0e3a2df7897 Uploaded iuc parents: diff changeset	180 2 can correctly assemble more reads with only slightly
b0e3a2df7897 Uploaded iuc parents: diff changeset	181 higher false-positive rate.
b0e3a2df7897 Uploaded iuc parents: diff changeset	182 -e, --empirical-freqs Disable empirical base frequencies. (default: use empirical
b0e3a2df7897 Uploaded iuc parents: diff changeset	183 base frequencies)
b0e3a2df7897 Uploaded iuc parents: diff changeset	184 -s, --score-method <int> Specify the scoring method. (default: 2)
b0e3a2df7897 Uploaded iuc parents: diff changeset	185 1. OES with +1 for match and -1 for mismatch.
b0e3a2df7897 Uploaded iuc parents: diff changeset	186 2: Assembly score (AS). Use +1 for match and -1 for mismatch
b0e3a2df7897 Uploaded iuc parents: diff changeset	187 multiplied by base quality scores.
b0e3a2df7897 Uploaded iuc parents: diff changeset	188 3: Ignore quality scores and use +1 for a match and -1 for a
b0e3a2df7897 Uploaded iuc parents: diff changeset	189 mismatch.
b0e3a2df7897 Uploaded iuc parents: diff changeset	190 -c, --cap <int> Specify the upper bound for the resulting quality score. If
b0e3a2df7897 Uploaded iuc parents: diff changeset	191 set to zero, capping is disabled. (default: 40)
b0e3a2df7897 Uploaded iuc parents: diff changeset	192 -z, --nbase When merging a base-pair that consists of two non-equal
b0e3a2df7897 Uploaded iuc parents: diff changeset	193 bases out of which none is degenerate, set the merged base
b0e3a2df7897 Uploaded iuc parents: diff changeset	194 to N and use the highest quality score of the two bases
b0e3a2df7897 Uploaded iuc parents: diff changeset	195
b0e3a2df7897 Uploaded iuc parents: diff changeset	196
b0e3a2df7897 Uploaded iuc parents: diff changeset	197
b0e3a2df7897 Uploaded iuc parents: diff changeset	198
b0e3a2df7897 Uploaded iuc parents: diff changeset	199 ]]>
b0e3a2df7897 Uploaded iuc parents: diff changeset	200 </help>
b0e3a2df7897 Uploaded iuc parents: diff changeset	201 <citations>
b0e3a2df7897 Uploaded iuc parents: diff changeset	202 <citation type="doi">10.1093/bioinformatics/btt593</citation>
b0e3a2df7897 Uploaded iuc parents: diff changeset	203 </citations>
b0e3a2df7897 Uploaded iuc parents: diff changeset	204 </tool>

Mercurial > repos > iuc > pear

annotate pear.xml @ 0:b0e3a2df7897 draft