funannotate_annotate: funannotate_annotate.xml comparison

comparison funannotate_annotate.xml @ 7:f6482e570d32 draft

planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/main/tools/funannotate commit 9e3708d04faea0f1be4ea8918e859d6f2c7eb31d

author	iuc
date	Wed, 26 Jun 2024 09:37:48 +0000
parents	c8eccad1b953
children	51ca9670dcd1

comparison

equal deleted inserted replaced

-:c8eccad1b953
+:f6482e570d32
-<tool id="funannotate_annotate" name="Funannotate functional" profile="20.01" version="@TOOL_VERSION@+galaxy@VERSION_SUFFIX@">
+<tool id="funannotate_annotate" name="Funannotate functional" profile="20.01" version="@TOOL_VERSION@+galaxy5">
 <description>annotation</description>
 <macros>
 <import>macros.xml</import>
 </macros>
+<expand macro="biotools" />
 <requirements>
 <expand macro="requirements" />
 </requirements>
 <version_command>funannotate check --show-versions</version_command>
 <command><![CDATA[
 --fasta '${input.fasta}'
 --species '${input.species}'
 #end if
 --out output
+--tmpdir "\${_GALAXY_JOB_TMP_DIR:-/tmp}"
 --database '$database.fields.path'
 #if $sbt:
 --sbt '${sbt}'
 --fix '${fix}'
 #end if
 #if $remove:
 --remove '${remove}'
 #end if
+--header_length $header_length
 --cpus \${GALAXY_SLOTS:-2}
 &&
-mv output/annotate_results/*.gbk out.gbk &&
+## Funannotate sometimes leaves multiple *part.tbl and *part.sqn files:
-mv output/annotate_results/*.annotations.txt out.annotations.txt &&
+## https://github.com/nextgenusfs/funannotate/issues/777
-mv output/annotate_results/*.contigs.fsa out.contigs.fsa &&
+## The partial tbl files are combined by funannotate and are deleted below.
-mv output/annotate_results/*.agp out.agp &&
+## The sqn files are discrete and are collected with discover_datasets.
-mv output/annotate_results/*.tbl out.tbl &&
+find output/annotate_results
-mv output/annotate_results/*.sqn out.sqn &&
+-regex ".*part_[0-9]+\.\(tbl\)$"
-mv output/annotate_results/*.scaffolds.fa out.scaffolds.fa &&
+-delete
-mv output/annotate_results/*.proteins.fa out.proteins.fa &&
-mv output/annotate_results/*.mrna-transcripts.fa out.mrna-transcripts.fa &&
-mv output/annotate_results/*.cds-transcripts.fa out.cds-transcripts.fa &&
-mv output/annotate_results/*.gff3 out.gff3 &&
-mv output/annotate_results/*.discrepency.report.txt out.discrepency.report.txt &&
-mv output/annotate_results/*.stats.json out.stats.json
 ]]></command>
 <inputs>
 <conditional name="input">
 <param name="input_type" type="select" label="Input format">
 <validator type="empty_field" />
 </param>
 </when>
 </conditional>
 <param name="database" label="Funannotate database" type="select">
 <options from_data_table="funannotate">
 <column name="value" index="0" />
 <column name="name" index="1" />
 <column name="path" index="3" />
 <param argument="--rename" type="text" label="locus_tag from NCBI to rename GFF gene models with" />
 <param argument="--fix" type="data" format="tabular" optional="true" label="Gene/Product names fixed" help="TSV: GeneID	Name	Product" />
 <param argument="--remove" type="data" format="tabular" optional="true" label="Gene/Product names to remove" help="TSV: Gene	Product" />
+<param argument="--header_length" type="integer" value="16" min="1" label="Maximum length of FASTA headers" help="The NCBI max FASTA header length is 16. Increase if you don't submit to NCBI." />
 <param name="outputs" type="select" optional="true" multiple="true" label="Which outputs should be generated">
 <option value="gbk" selected="true">Annotated genome (genbank)</option>
 <option value="annotations">TSV file of all annotations added to genome. (i.e. import into excel)</option>
 <option value="contigs_fsa">Multi-fasta file of contigs, split at gaps (use for NCBI submission)</option>
 <option value="agp">AGP file; showing linkage/location of contigs (use for NCBI submission)</option>
 <option value="need_curating">TSV file of Gene Name/Product defines that need to be curated</option>
 <option value="new_names_passed">TSV file of Gene Name/Product deflines that passed tbl2asn but are not in Gene2Products database.</option>
 </param>
 </inputs>
 <outputs>
-<data name='gbk' format='genbank' label="${tool.name} on ${on_string}: annotated genome (genbank)" from_work_dir="out.gbk">
+<data name='gbk' format='genbank' label="${tool.name} on ${on_string}: annotated genome (genbank)" from_work_dir="output/annotate_results/*.gbk">
 <filter>outputs and 'gbk' in outputs</filter>
 </data>
-<data name='annot' format='tabular' label="${tool.name} on ${on_string}: all annotations" from_work_dir="out.annotations.txt">
+<data name='annot' format='tabular' label="${tool.name} on ${on_string}: all annotations" from_work_dir="output/annotate_results/*.annotations.txt">
 <filter>outputs and 'annotations' in outputs</filter>
 </data>
-<data name='contigs_fsa' format='fasta' label="${tool.name} on ${on_string}: contigs fasta, split at gaps" from_work_dir="out.contigs.fsa">
+<data name='contigs_fsa' format='fasta' label="${tool.name} on ${on_string}: contigs fasta, split at gaps" from_work_dir="output/annotate_results/*.contigs.fsa">
 <filter>outputs and 'contigs_fsa' in outputs</filter>
 </data>
-<data name='agp' format='tabular' label="${tool.name} on ${on_string}: AGP file" from_work_dir="out.agp">
+<data name='agp' format='tabular' label="${tool.name} on ${on_string}: AGP file" from_work_dir="output/annotate_results/*.agp">
 <filter>outputs and 'agp' in outputs</filter>
 </data>
-<data name='tbl' format='txt' label="${tool.name} on ${on_string}: NCBI tbl annotation file" from_work_dir="out.tbl">
+<data name='tbl' format='txt' label="${tool.name} on ${on_string}: NCBI tbl annotation file" from_work_dir="output/annotate_results/*.tbl">
 <filter>outputs and 'tbl' in outputs</filter>
 </data>
-<data name='sqn' format='txt' label="${tool.name} on ${on_string}: NCBI Sequin genome" from_work_dir="out.sqn">
+<collection name="sqn" type="list" label="${tool.name} on ${on_string}: NCBI Sequin genome files">
+<discover_datasets pattern="(?P&lt;designation&gt;.+)\.sqn" directory="output/annotate_results" format="txt" recurse="false"/>
 <filter>outputs and 'sqn' in outputs</filter>
-</data>
+</collection>
-<data name='fa_scaffolds' format='fasta' label="${tool.name} on ${on_string}: scaffolds sequences" from_work_dir="out.scaffolds.fa">
+<data name='fa_scaffolds' format='fasta' label="${tool.name} on ${on_string}: scaffolds sequences" from_work_dir="output/annotate_results/*.scaffolds.fa">
 <filter>outputs and 'scaffolds_fa' in outputs</filter>
 </data>
-<data name='fa_proteins' format='fasta' label="${tool.name} on ${on_string}: protein sequences" from_work_dir="out.proteins.fa">
+<data name='fa_proteins' format='fasta' label="${tool.name} on ${on_string}: protein sequences" from_work_dir="output/annotate_results/*.proteins.fa">
 <filter>outputs and 'proteins_fa' in outputs</filter>
 </data>
-<data name='fa_transcripts_mrna' format='fasta' label="${tool.name} on ${on_string}: transcript mRNA sequences" from_work_dir="out.mrna-transcripts.fa">
+<data name='fa_transcripts_mrna' format='fasta' label="${tool.name} on ${on_string}: transcript mRNA sequences" from_work_dir="output/annotate_results/*.mrna-transcripts.fa">
 <filter>outputs and 'mrna_transcripts_fa' in outputs</filter>
 </data>
-<data name='fa_transcripts_cds' format='fasta' label="${tool.name} on ${on_string}: transcript CDS sequences" from_work_dir="out.cds-transcripts.fa">
+<data name='fa_transcripts_cds' format='fasta' label="${tool.name} on ${on_string}: transcript CDS sequences" from_work_dir="output/annotate_results/*.cds-transcripts.fa">
 <filter>outputs and 'cds_transcripts_fa' in outputs</filter>
 </data>
-<data name='gff3' format='gff3' label="${tool.name} on ${on_string}: annotation (GFF3)" from_work_dir="out.gff3">
+<data name='gff3' format='gff3' label="${tool.name} on ${on_string}: annotation (GFF3)" from_work_dir="output/annotate_results/*.gff3">
 <filter>outputs and 'gff3' in outputs</filter>
 </data>
-<data name='tbl2asn_report' format='txt' label="${tool.name} on ${on_string}: tbl2asn summary report of annotated genome" from_work_dir="out.discrepency.report.txt">
+<data name='tbl2asn_report' format='txt' label="${tool.name} on ${on_string}: tbl2asn summary report of annotated genome" from_work_dir="output/annotate_results/*.discrepency.report.txt">
 <filter>outputs and 'discrepency' in outputs</filter>
 </data>
-<data name='stats' format='json' label="${tool.name} on ${on_string}: stats" from_work_dir="out.stats.json">
+<data name='stats' format='json' label="${tool.name} on ${on_string}: stats" from_work_dir="output/annotate_results/*.stats.json">
 <filter>outputs and 'gbk' in outputs</filter>
 </data>
 <data name='must_fix' format='json' label="${tool.name} on ${on_string}: Gene Name/Product must-fix" from_work_dir="output/annotate_results/Gene2Products.must-fix.txt">
 <filter>outputs and 'must_fix' in outputs</filter>
 </data>
 <data name='new_names_passed' format='json' label="${tool.name} on ${on_string}: Gene Name/Product new-names-passed" from_work_dir="output/annotate_results/Gene2Products.new-names-passed.txt">
 <filter>outputs and 'new_names_passed' in outputs</filter>
 </data>
 </outputs>
 <tests>
-<test>
+<test expect_num_outputs="16">
 <conditional name="input">
 <param name="input_type" value="gbk" />
 <param name="genbank" value="predict_augustus/Genus_species.gbk" />
 </conditional>
 <param name="database" value="2021-07-20-120000" />
 <output name="tbl">
 <assert_contents>
 <has_text text="locus_tag" />
 </assert_contents>
 </output>
-<output name="sqn">
+<output_collection name="sqn" type="list">
-<assert_contents>
+<element name="Genus_species">
-<has_text text="Seq-submit" />
+<assert_contents>
-</assert_contents>
+<has_text text="Seq-submit" />
-</output>
+</assert_contents>
+</element>
+</output_collection>
 <output name="fa_scaffolds">
 <assert_contents>
 <has_text text=">sample" />
 </assert_contents>
 </output>
 <assert_contents>
 <has_text text="Passed Description" />
 </assert_contents>
 </output>
 </test>
-<test>
+<test expect_num_outputs="16">
 <conditional name="input">
 <param name="input_type" value="gff" />
 <param name="gff" value="predict_augustus/Genus_species.gff3" />
 <param name="fasta" value="genome.fa" />
 <param name="species" value="Genus species" />
 <output name="tbl">
 <assert_contents>
 <has_text text="locus_tag" />
 </assert_contents>
 </output>
-<output name="sqn">
+<output_collection name="sqn" type="list">
-<assert_contents>
+<element name="Genus_species">
-<has_text text="Seq-submit" />
+<assert_contents>
-</assert_contents>
+<has_text text="Seq-submit" />
-</output>
+</assert_contents>
+</element>
+</output_collection>
 <output name="fa_scaffolds">
 <assert_contents>
 <has_text text=">sample" />
 </assert_contents>
 </output>

Mercurial > repos > iuc > funannotate_annotate

comparison funannotate_annotate.xml @ 7:f6482e570d32 draft