mutation_analysis: wrapper.sh annotate

annotate wrapper.sh @ 120:613278c1bde0 draft

Uploaded

author	davidvanzessen
date	Tue, 16 Aug 2016 09:10:50 -0400
parents	626a956f3811
children	31cca6d3722a

rev	line source
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	1 #!/bin/bash
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	2 #set -e
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	3 dir="$(cd "$(dirname "$0")" && pwd)"
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	4 input=$1
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	5 method=$2
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	6 log=$3 #becomes the main html page at the end
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	7 outdir=$4
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	8 output="$outdir/index.html" #copied to $log location at the end
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	9 title=$5
22 d84c9791d8c4 Uploaded davidvanzessen parents: 21 diff changeset	10 include_fr1=$6
34 d436daae9d68 Uploaded davidvanzessen parents: 32 diff changeset	11 functionality=$7
d436daae9d68 Uploaded davidvanzessen parents: 32 diff changeset	12 unique=$8
69 7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	13 naive_output_ca=$9
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	14 naive_output_cg=${10}
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	15 naive_output_cm=${11}
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	16 filter_unique=${12}
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	17 class_filter=${13}
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	18 empty_region_filter=${14}
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	19 mkdir $outdir
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	20
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	21 tar -xzf $dir/style.tar.gz -C $outdir
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	22
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	23 echo "---------------- read parameters ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	24 echo "---------------- read parameters ----------------<br />" > $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	25
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	26 echo "unpacking IMGT file"
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	27
35 8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	28 type="`file $input`"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	29 if [[ "$type" == "Zip archive" ]] ; then
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	30 echo "Zip archive"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	31 echo "unzip $input -d $PWD/files/"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	32 unzip $input -d $PWD/files/
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	33 elif [[ "$type" == "XZ compressed data" ]] ; then
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	34 echo "ZX archive"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	35 echo "tar -xJf $input -C $PWD/files/"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	36 mkdir -p $PWD/files/$title
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	37 tar -xJf $input -C $PWD/files/$title
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	38 fi
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	39
64 0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	40 cat `find $PWD/files/ -name "1_*"` > $PWD/summary.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	41 cat `find $PWD/files/ -name "3_*"` > $PWD/sequences.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	42 cat `find $PWD/files/ -name "5_*"` > $PWD/aa.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	43 cat `find $PWD/files/ -name "6_*"` > $PWD/junction.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	44 cat `find $PWD/files/ -name "7_*"` > $PWD/mutationanalysis.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	45 cat `find $PWD/files/ -name "8_*"` > $PWD/mutationstats.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	46 cat `find $PWD/files/ -name "10_*"` > $PWD/hotspots.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	47
119 626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	48 if [[ ${#BLASTN_DIR} -ge 5 ]] ; then
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	49 echo "On server, using BLASTN_DIR env: ${BLASTN_DIR}"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	50 else
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	51 BLASTN_DIR="/home/galaxy/Downloads/ncbi-blast-2.4.0+/bin"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	52 echo "Dev Galaxy set BLASTN_DIR to: ${BLASTN_DIR}"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	53 fi
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	54
89 480fdd383fdb Uploaded davidvanzessen parents: 85 diff changeset	55 echo "---------------- identification ($method) ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	56 echo "---------------- identification ($method) ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	57
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	58 if [[ "${method}" == "custom" ]] ; then
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	59 python $dir/gene_identification.py --input $PWD/summary.txt --output $outdir/identified_genes.txt
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	60 else
119 626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	61 echo "---------------- summary_to_fasta.py ----------------"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	62 echo "---------------- summary_to_fasta.py ----------------<br />" >> $log
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	63
119 626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	64 python $dir/summary_to_fasta.py --input $PWD/summary.txt --fasta $PWD/sequences.fasta
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	65
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	66 echo -e "qseqid\tsseqid\tpident\tlength\tmismatch\tgapopen\tqstart\tqend\tsstart\tsend\tevalue\tbitscore" > $outdir/identified_genes.txt
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	67 ${BLASTN_DIR}/blastn -task blastn -db $dir/subclass_definition.db -query $PWD/sequences.fasta -outfmt 6 >> $outdir/identified_genes.txt
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	68 fi
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	69
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	70 echo "---------------- merge_and_filter.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	71 echo "---------------- merge_and_filter.r ----------------<br />" >> $log
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	72
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	73 Rscript $dir/merge_and_filter.r $PWD/summary.txt $PWD/sequences.txt $PWD/mutationanalysis.txt $PWD/mutationstats.txt $PWD/hotspots.txt $outdir/identified_genes.txt $outdir/merged.txt $outdir/before_unique_filter.txt $outdir/unmatched.txt $method $functionality $unique ${filter_unique} ${class_filter} ${empty_region_filter} 2>&1
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	74
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 95 diff changeset	75 echo "---------------- creating new IMGT zip ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	76 echo "---------------- creating new IMGT zip ----------------<br />" >> $log
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	77
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	78 mkdir $outdir/new_IMGT
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	79
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	80 cat `find $PWD/files/ -name "1_*"` > "$outdir/new_IMGT/1_Summary.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	81 cat `find $PWD/files/ -name "2_*"` > "$outdir/new_IMGT/2_IMGT-gapped-nt-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	82 cat `find $PWD/files/ -name "3_*"` > "$outdir/new_IMGT/3_Nt-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	83 cat `find $PWD/files/ -name "4_*"` > "$outdir/new_IMGT/4_IMGT-gapped-AA-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	84 cat `find $PWD/files/ -name "5_*"` > "$outdir/new_IMGT/5_AA-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	85 cat `find $PWD/files/ -name "6_*"` > "$outdir/new_IMGT/6_Junction.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	86 cat `find $PWD/files/ -name "7_*"` > "$outdir/new_IMGT/7_V-REGION-mutation-and-AA-change-table.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	87 cat `find $PWD/files/ -name "8_*"` > "$outdir/new_IMGT/8_V-REGION-nt-mutation-statistics.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	88 cat `find $PWD/files/ -name "9_*"` > "$outdir/new_IMGT/9_V-REGION-AA-change-statistics.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	89 cat `find $PWD/files/ -name "10_*"` > "$outdir/new_IMGT/10_V-REGION-mutation-hotspots.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	90
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	91 mkdir $outdir/new_IMGT_ca
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	92 cp $outdir/new_IMGT/* $outdir/new_IMGT_ca
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	93
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	94 mkdir $outdir/new_IMGT_ca1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	95 cp $outdir/new_IMGT/* $outdir/new_IMGT_ca1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	96
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	97 mkdir $outdir/new_IMGT_ca2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	98 cp $outdir/new_IMGT/* $outdir/new_IMGT_ca2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	99
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	100 mkdir $outdir/new_IMGT_cg
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	101 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	102
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	103 mkdir $outdir/new_IMGT_cg1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	104 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	105
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	106 mkdir $outdir/new_IMGT_cg2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	107 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	108
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	109 mkdir $outdir/new_IMGT_cg3
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	110 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg3
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	111
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	112 mkdir $outdir/new_IMGT_cg4
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	113 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg4
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	114
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	115 mkdir $outdir/new_IMGT_cm
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	116 cp $outdir/new_IMGT/* $outdir/new_IMGT_cm
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	117
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	118 Rscript $dir/new_imgt.r $outdir/new_IMGT/ $outdir/merged.txt "-" 2>&1
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	119
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	120 Rscript $dir/new_imgt.r $outdir/new_IMGT_ca/ $outdir/merged.txt "ca" 2>&1
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	121 Rscript $dir/new_imgt.r $outdir/new_IMGT_ca1/ $outdir/merged.txt "ca1" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	122 Rscript $dir/new_imgt.r $outdir/new_IMGT_ca2/ $outdir/merged.txt "ca2" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	123
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	124 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg/ $outdir/merged.txt "cg" 2>&1
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	125 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg1/ $outdir/merged.txt "cg1" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	126 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg2/ $outdir/merged.txt "cg2" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	127 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg3/ $outdir/merged.txt "cg3" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	128 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg4/ $outdir/merged.txt "cg4" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	129
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	130 Rscript $dir/new_imgt.r $outdir/new_IMGT_cm/ $outdir/merged.txt "cm" 2>&1
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	131
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	132
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	133 tmp="$PWD"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	134 cd $outdir/new_IMGT/ #tar weirdness...
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	135 tar -cJf ../new_IMGT.txz *
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	136
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	137 cd $outdir/new_IMGT_ca/
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	138 tar -cJf ../new_IMGT_ca.txz *
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	139
117 a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	140 cd $outdir/new_IMGT_ca1/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	141 tar -cJf ../new_IMGT_ca1.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	142
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	143 cd $outdir/new_IMGT_ca2/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	144 tar -cJf ../new_IMGT_ca2.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	145
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	146 cd $outdir/new_IMGT_cg/
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	147 tar -cJf ../new_IMGT_cg.txz *
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	148
117 a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	149 cd $outdir/new_IMGT_cg1/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	150 tar -cJf ../new_IMGT_cg1.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	151
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	152 cd $outdir/new_IMGT_cg2/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	153 tar -cJf ../new_IMGT_cg2.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	154
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	155 cd $outdir/new_IMGT_cg3/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	156 tar -cJf ../new_IMGT_cg3.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	157
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	158 cd $outdir/new_IMGT_cg4/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	159 tar -cJf ../new_IMGT_cg4.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	160
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	161 cd $outdir/new_IMGT_cm/
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	162 tar -cJf ../new_IMGT_cm.txz *
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	163
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	164 cd $tmp
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	165
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	166 echo "---------------- mutation_analysis.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	167 echo "---------------- mutation_analysis.r ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	168
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	169 classes="ca,ca1,ca2,cg,cg1,cg2,cg3,cg4,cm,unmatched"
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	170 echo "R mutation analysis"
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	171 Rscript $dir/mutation_analysis.r $outdir/merged.txt $classes $outdir ${include_fr1} 2>&1
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	172
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	173
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	174 echo "---------------- mutation_analysis.py ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	175 echo "---------------- mutation_analysis.py ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	176
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	177 python $dir/mutation_analysis.py --input $outdir/merged.txt --genes $classes --includefr1 "${include_fr1}" --output $outdir/hotspot_analysis.txt
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	178
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	179 echo "---------------- aa_histogram.r ----------------"
105 e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	180 echo "---------------- aa_histogram.r ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	181
107 01c9993865af Uploaded davidvanzessen parents: 105 diff changeset	182 Rscript $dir/aa_histogram.r $outdir/aa_id_mutations.txt $outdir/absent_aa_id.txt "ca,cg,cm" $outdir/ 2>&1
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	183 if [ -e "$outdir/aa_histogram_.png" ]; then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	184 mv $outdir/aa_histogram_.png $outdir/aa_histogram.png
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	185 mv $outdir/aa_histogram_.txt $outdir/aa_histogram.txt
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	186 fi
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	187
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	188 genes=(ca ca1 ca2 cg cg1 cg2 cg3 cg4 cm)
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	189
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	190 funcs=(sum mean median)
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	191 funcs=(sum)
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	192
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	193 echo "---------------- sequence_overview.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	194 echo "---------------- sequence_overview.r ----------------<br />" >> $log
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	195
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	196 mkdir $outdir/sequence_overview
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	197
90 f0e8dac22c6e Uploaded davidvanzessen parents: 89 diff changeset	198 #Rscript $dir/sequence_overview.r $outdir/identified_genes.txt $PWD/sequences.txt $outdir/merged.txt $outdir/sequence_overview $classes $outdir/hotspot_analysis_sum.txt 2>&1
100 ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	199 Rscript $dir/sequence_overview.r $outdir/before_unique_filter.txt $outdir/merged.txt $outdir/sequence_overview $classes $outdir/hotspot_analysis_sum.txt 2>&1
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	200
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	201 echo "<table border='1'>" > $outdir/base_overview.html
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	202
92 b869a126e2c4 Uploaded davidvanzessen parents: 90 diff changeset	203 while IFS=$'\t' read ID class seq A C G T
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	204 do
85 07f7da724a77 Uploaded davidvanzessen parents: 84 diff changeset	205 echo "<tr><td>$ID</td><td>$seq</td><td>$class</td><td>$A</td><td>$C</td><td>$G</td><td>$T</td></tr>" >> $outdir/base_overview.html
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	206 done < $outdir/sequence_overview/ntoverview.txt
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	207
62 4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	208 echo "<html><center><h1>$title</h1></center>" > $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	209 echo "<script type='text/javascript' src='jquery-1.11.0.min.js'></script>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	210 echo "<script type='text/javascript' src='tabber.js'></script>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	211 echo "<script type='text/javascript' src='script.js'></script>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	212 echo "<link rel='stylesheet' type='text/css' href='style.css'>" >> $output
62 4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	213
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	214 #display the matched/unmatched for clearity
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	215
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 95 diff changeset	216 matched_count="`cat $outdir/merged.txt \| grep -v 'unmatched' \| tail -n +2 \| wc -l`"
62 4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	217 unmatched_count="`cat $outdir/unmatched.txt \| tail -n +2 \| wc -l`"
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	218 total_count=$((matched_count + unmatched_count))
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	219 perc_count=$((unmatched_count / total_count * 100))
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	220 perc_count=`bc -l <<< "scale=2; ${unmatched_count} / ${total_count} * 100"`
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	221 perc_count=`bc -l <<< "scale=2; (${unmatched_count} / ${total_count} * 100 ) / 1"`
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	222
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	223 echo "<center><h2>Total: ${total_count}</h2></center>" >> $output
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	224 echo "<center><h2>Matched: ${matched_count} Unmatched: ${unmatched_count}</h2></center>" >> $output
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	225 echo "<center><h2>Percentage unmatched: ${perc_count}</h2></center>" >> $output
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	226
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	227 echo "---------------- main tables ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	228 echo "---------------- main tables ----------------<br />" >> $log
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	229
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	230 echo "<div class='tabber'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	231 echo "<div class='tabbertab' title='SHM Overview'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	232
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	233 for func in ${funcs[@]}
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	234 do
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	235
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	236 echo "---------------- $func table ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	237 echo "---------------- $func table ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	238
94 e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	239 cat $outdir/mutations_${func}.txt $outdir/hotspot_analysis_${func}.txt > $outdir/data_${func}.txt
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	240
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 95 diff changeset	241 echo "<table border='1' width='100%'><caption><h3><a href='data_${func}.txt'>${func} table</a></h3></caption>" >> $output
58 8bb4d6009e08 Uploaded davidvanzessen parents: 55 diff changeset	242 echo "<tr><th>info</th>" >> $output
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	243 for gene in ${genes[@]}
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	244 do
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	245 tmp=`cat $outdir/${gene}_${func}_n.txt`
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	246 echo "<th><a href='matched_${gene}_${func}.txt'>${gene} (N = $tmp)</a></th>" >> $output
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	247 done
78 b523ce95d857 Uploaded davidvanzessen parents: 77 diff changeset	248
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	249 tmp=`cat $outdir/all_${func}_n.txt`
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	250 echo "<th><a href='matched_all_${func}.txt'>all (N = $tmp)</a></th>" >> $output
78 b523ce95d857 Uploaded davidvanzessen parents: 77 diff changeset	251 tmp=`cat $outdir/unmatched_${func}_n.txt`
79 0513b46178c4 Uploaded davidvanzessen parents: 78 diff changeset	252 echo "<th><a href='unmatched.txt'>unmatched (N = ${unmatched_count})</a></th>" >> $output
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	253
78 b523ce95d857 Uploaded davidvanzessen parents: 77 diff changeset	254 while IFS=, read name cax cay caz ca1x ca1y ca1z ca2x ca2y ca2z cgx cgy cgz cg1x cg1y cg1z cg2x cg2y cg2z cg3x cg3y cg3z cg4x cg4y cg4z cmx cmy cmz unx uny unz allx ally allz
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	255 do
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	256 if [ "$name" == "FR S/R (ratio)" ] \|\| [ "$name" == "CDR S/R (ratio)" ] ; then #meh
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	257 echo "<tr><td>$name</td><td>${cax}/${cay} (${caz})</td><td>${ca1x}/${ca1y} (${ca1z})</td><td>${ca2x}/${ca2y} (${ca2z})</td><td>${cgx}/${cgy} (${cgz})</td><td>${cg1x}/${cg1y} (${cg1z})</td><td>${cg2x}/${cg2y} (${cg2z})</td><td>${cg3x}/${cg3y} (${cg3z})</td><td>${cg4x}/${cg4y} (${cg4z})</td><td>${cmx}/${cmy} (${cmz})</td><td>${allx}/${ally} (${allz})</td></tr>" >> $output
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	258 else
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	259 echo "<tr><td>$name</td><td>${cax}/${cay} (${caz}%)</td><td>${ca1x}/${ca1y} (${ca1z}%)</td><td>${ca2x}/${ca2y} (${ca2z}%)</td><td>${cgx}/${cgy} (${cgz}%)</td><td>${cg1x}/${cg1y} (${cg1z}%)</td><td>${cg2x}/${cg2y} (${cg2z}%)</td><td>${cg3x}/${cg3y} (${cg3z}%)</td><td>${cg4x}/${cg4y} (${cg4z}%)</td><td>${cmx}/${cmy} (${cmz}%)</td><td>${allx}/${ally} (${allz}%)</td><td>${unx}/${uny} (${unz}%)</td></tr>" >> $output
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	260 fi
94 e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	261 done < $outdir/data_${func}.txt
e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	262 echo "</table>" >> $output
e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	263 #echo "<a href='data_${func}.txt'>Download data</a>" >> $output
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	264 done
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	265
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	266 echo "</div>" >> $output #SHM overview tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	267
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	268 echo "---------------- images ----------------"
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	269 echo "---------------- images ----------------<br />" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	270
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	271 echo "<div class='tabbertab' title='SHM Frequency'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	272
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	273 if [ -a $outdir/scatter.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	274 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	275 echo "<img src='scatter.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	276 echo "<a href='scatter.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	277 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	278 if [ -a $outdir/frequency_ranges.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	279 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	280 echo "<img src='frequency_ranges.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	281 echo "<a href='frequency_ranges_classes.txt'>download class data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	282 echo "<a href='frequency_ranges_subclasses.txt'>download subclass data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	283 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	284
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	285 echo "</div>" >> $output #SHM frequency tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	286
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	287 echo "<div class='tabbertab' title='Transition tables'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	288
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	289 echo "<table border='0'>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	290
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	291 for gene in ${genes[@]}
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	292 do
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	293 echo "<tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	294 echo "<td><h1>${gene}</h1></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	295 echo "<td><img src='transitions_heatmap_${gene}.png' /></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	296 echo "<td><img src='transitions_stacked_${gene}.png' /></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	297 echo "<td><table border='1'>" >> $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	298 while IFS=, read from a c g t
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	299 do
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	300 echo "<tr><td>$from</td><td>$a</td><td>$c</td><td>$g</td><td>$t</td></tr>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	301 done < $outdir/transitions_${gene}_sum.txt
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	302 echo "</table></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	303
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	304 echo "</tr>" >> $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	305 done
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	306
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	307 echo "<tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	308 echo "<td><h1>All</h1></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	309 echo "<td><img src='transitions_heatmap_all.png' /></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	310 echo "<td><img src='transitions_stacked_all.png' /></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	311 echo "<td><table border='1'>" >> $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	312 while IFS=, read from a c g t
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	313 do
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	314 echo "<tr><td>$from</td><td>$a</td><td>$c</td><td>$g</td><td>$t</td></tr>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	315 done < $outdir/transitions_all_sum.txt
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	316 echo "</table></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	317
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	318 echo "</tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	319
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	320 echo "</table>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	321
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	322 echo "</div>" >> $output #transition tables tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	323
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	324 echo "<div class='tabbertab' title='Antigen Selection'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	325
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	326 if [ -a $outdir/aa_histogram.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	327 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	328 echo "<img src='aa_histogram.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	329 echo "<a href='aa_histogram.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	330 echo "<img src='aa_histogram_ca.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	331 echo "<a href='aa_histogram_ca.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	332 echo "<img src='aa_histogram_cg.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	333 echo "<a href='aa_histogram_cg.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	334 echo "<img src='aa_histogram_cm.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	335 echo "<a href='aa_histogram_cm.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	336 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	337
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	338 echo "<embed src='baseline_ca.pdf' width='700px' height='1000px'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	339 echo "<embed src='baseline_cg.pdf' width='700px' height='1000px'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	340 echo "<embed src='baseline_cm.pdf' width='700px' height='1000px'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	341
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	342 echo "</div>" >> $output #antigen selection tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	343
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	344 echo "<div class='tabbertab' title='CSR'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	345
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	346 if [ -a $outdir/ca.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	347 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	348 echo "<img src='ca.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	349 echo "<a href='ca.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	350 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	351 if [ -a $outdir/cg.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	352 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	353 echo "<img src='cg.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	354 echo "<a href='cg.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	355 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	356
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	357 echo "</div>" >> $output #CSR tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	358
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	359 echo "<div class='tabbertab' title='Downloads'>" >> $output
94 e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	360
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	361 echo "<table border='1' width='700px'>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	362 echo "<tr><td>The complete dataset</td><td><a href='merged.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	363 echo "<tr><td>The alignment info on the unmatched sequences</td><td><a href='unmatched.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	364 echo "<tr><td>Motif data per sequence ID</td><td><a href='motif_per_seq.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	365 echo "<tr><td>Mutation data per sequence ID</td><td><a href='mutation_by_id.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	366 echo "<tr><td>AA mutation data per sequence ID</td><td><a href='aa_id_mutations.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	367 echo "<tr><td>Absent AA location data per sequence ID</td><td><a href='absent_aa_id.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	368 echo "<tr><td>CDR1+FR2+CDR2+FR3+CDR3 sequences that show up more than once</td><td><a href='sequence_overview/index.html'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	369 echo "<tr><td>Base count for every sequence</td><td><a href='base_overview.html'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	370 echo "<tr><td>Baseline PDF (<href a='http://selection.med.yale.edu/baseline/'>http://selection.med.yale.edu/baseline/</a>)</td><td><a href='baseline.pdf'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	371 echo "<tr><td>Baseline data</td><td><a href='baseline.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	372 echo "<tr><td>Baseline ca PDF</td><td><a href='baseline_ca.pdf'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	373 echo "<tr><td>Baseline ca data</td><td><a href='baseline_ca.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	374 echo "<tr><td>Baseline cg PDF</td><td><a href='baseline_cg.pdf'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	375 echo "<tr><td>Baseline cg data</td><td><a href='baseline_cg.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	376 echo "<tr><td>Baseline cm PDF</td><td><a href='baseline_cm.pdf'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	377 echo "<tr><td>Baseline cm data</td><td><a href='baseline_cm.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	378 echo "<tr><td>An IMGT archive with just the matched and filtered sequences</td><td><a href='new_IMGT.txz'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	379 echo "<tr><td>An IMGT archive with just the matched and filtered ca sequences</td><td><a href='new_IMGT_ca.txz'>Download</a></td></tr>" >> $output
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	380 echo "<tr><td>An IMGT archive with just the matched and filtered ca1 sequences</td><td><a href='new_IMGT_ca1.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	381 echo "<tr><td>An IMGT archive with just the matched and filtered ca2 sequences</td><td><a href='new_IMGT_ca2.txz'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	382 echo "<tr><td>An IMGT archive with just the matched and filtered cg sequences</td><td><a href='new_IMGT_cg.txz'>Download</a></td></tr>" >> $output
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	383 echo "<tr><td>An IMGT archive with just the matched and filtered cg1 sequences</td><td><a href='new_IMGT_cg1.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	384 echo "<tr><td>An IMGT archive with just the matched and filtered cg2 sequences</td><td><a href='new_IMGT_cg2.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	385 echo "<tr><td>An IMGT archive with just the matched and filtered cg3 sequences</td><td><a href='new_IMGT_cg3.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	386 echo "<tr><td>An IMGT archive with just the matched and filtered cg4 sequences</td><td><a href='new_IMGT_cg4.txz'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	387 echo "<tr><td>An IMGT archive with just the matched and filtered cm sequences</td><td><a href='new_IMGT_cm.txz'>Download</a></td></tr>" >> $output
120 613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	388 echo "<tr><td>The Change-O DB file with defined clones</td><td><a href='change_o/change-o-db-defined_clones.txt'>Download</a></td></tr>" >> $output
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	389 echo "<tr><td>The Change-O DB defined clones summary file</td><td><a href='change_o/change-o-defined_clones-summary.txt'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	390 echo "</table>" >> $output
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	391
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	392 echo "</div>" >> $output #downloads tab end
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	393
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	394 echo "</div>" >> $output #tabs end
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	395
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	396 echo "</html>" >> $output
2 2f4298673519 Uploaded davidvanzessen parents: 1 diff changeset	397
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	398 echo "---------------- baseline ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	399 echo "---------------- baseline ----------------<br />" >> $log
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	400 tmp="$PWD"
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	401
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	402 mkdir $outdir/baseline
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	403
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	404
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	405 mkdir $outdir/baseline/ca_cg_cm
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	406 if [[ $(wc -l < $outdir/new_IMGT/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	407 cd $outdir/baseline/ca_cg_cm
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	408 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT.txz "ca_cg_cm" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline.pdf" "Sequence.ID" "$outdir/baseline.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	409 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	410 echo "No sequences" > "$outdir/baseline.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	411 fi
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	412
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	413 mkdir $outdir/baseline/ca
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	414 if [[ $(wc -l < $outdir/new_IMGT_ca/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	415 cd $outdir/baseline/ca
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	416 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT_ca.txz "ca" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline_ca.pdf" "Sequence.ID" "$outdir/baseline_ca.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	417 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	418 echo "No ca sequences" > "$outdir/baseline_ca.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	419 fi
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	420
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	421 mkdir $outdir/baseline/cg
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	422 if [[ $(wc -l < $outdir/new_IMGT_cg/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	423 cd $outdir/baseline/cg
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	424 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT_cg.txz "cg" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline_cg.pdf" "Sequence.ID" "$outdir/baseline_cg.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	425 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	426 echo "No cg sequences" > "$outdir/baseline_cg.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	427 fi
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	428
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	429 mkdir $outdir/baseline/cm
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	430 if [[ $(wc -l < $outdir/new_IMGT_cm/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	431 cd $outdir/baseline/cm
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	432 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT_cm.txz "cm" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline_cm.pdf" "Sequence.ID" "$outdir/baseline_cm.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	433 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	434 echo "No cm sequences" > "$outdir/baseline_cm.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	435 fi
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	436
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	437 cd $tmp
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	438
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	439 echo "---------------- naive_output.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	440 echo "---------------- naive_output.r ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	441
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	442 if [[ "$naive_output" != "None" ]]
099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	443 then
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	444 cp $outdir/new_IMGT_ca.txz ${naive_output_ca}
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	445 cp $outdir/new_IMGT_cg.txz ${naive_output_cg}
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	446 cp $outdir/new_IMGT_cm.txz ${naive_output_cm}
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	447 fi
099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	448
81 a778156dad3d Uploaded davidvanzessen parents: 80 diff changeset	449 echo "</table>" >> $outdir/base_overview.html
a778156dad3d Uploaded davidvanzessen parents: 80 diff changeset	450
120 613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	451 echo "---------------- change-o MakeDB ----------------"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	452 echo "---------------- change-o MakeDB ----------------<br />" >> $log
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	453
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	454 mkdir $outdir/change_o
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	455
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	456 tmp="$PWD"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	457
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	458 cd $outdir/change_o
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	459
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	460 bash $dir/change_o/makedb.sh $input false false false $outdir/change_o/change-o-db.txt
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	461
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	462 echo "---------------- change-o DefineClones ----------------"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	463 echo "---------------- change-o DefineClones ----------------<br />" >> $log
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	464
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	465 bash $dir/change_o/define_clones.sh bygroup $outdir/change_o/change-o-db.txt gene first ham none min complete 3.0 $outdir/change_o/change-o-db-defined_clones.txt $outdir/change_o/change-o-defined_clones-summary.txt
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	466
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	467 PWD="$tmp"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	468
105 e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	469 mv $log $outdir/log.html
e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	470
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	471 echo "<html><center><h1><a href='index.html'>Click here for the results</a></h1>Tip: Open it in a new tab (middle mouse button or right mouse button -> 'open in new tab' on the link above)<br />" > $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	472 echo "<table border = 1>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	473 echo "<thead><tr><th>Info</th><th>Sequences</th><th>Percentage</th></tr></thead>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	474 tIFS="$TMP"
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	475 IFS=$'\t'
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	476 while read step seq perc
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	477 do
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	478 echo "<tr>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	479 echo "<td>$step</td>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	480 echo "<td>$seq</td>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	481 echo "<td>${perc}%</td>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	482 echo "</tr>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	483 done < $outdir/filtering_steps.txt
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	484 echo "</table border></center></html>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	485
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	486 IFS="$tIFS"
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	487
105 e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	488
81 a778156dad3d Uploaded davidvanzessen parents: 80 diff changeset	489 echo "---------------- Done! ----------------"
107 01c9993865af Uploaded davidvanzessen parents: 105 diff changeset	490 echo "---------------- Done! ----------------<br />" >> $outdir/log.html
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	491
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	492
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	493
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	494
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	495
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	496
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	497
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	498
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	499
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	500
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	501
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	502
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	503
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	504
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	505
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	506
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	507
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	508
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	509
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	510
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	511

Mercurial > repos > davidvanzessen > mutation_analysis

annotate wrapper.sh @ 120:613278c1bde0 draft