mutation_analysis: wrapper.sh annotate

annotate wrapper.sh @ 123:0453ea4d9f14 draft

Uploaded

author	davidvanzessen
date	Mon, 22 Aug 2016 07:00:23 -0400
parents	3d64b3efd352
children	4a93146f87aa

rev	line source
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	1 #!/bin/bash
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	2 #set -e
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	3 dir="$(cd "$(dirname "$0")" && pwd)"
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	4 input=$1
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	5 method=$2
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	6 log=$3 #becomes the main html page at the end
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	7 outdir=$4
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	8 output="$outdir/index.html" #copied to $log location at the end
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	9 title=$5
22 d84c9791d8c4 Uploaded davidvanzessen parents: 21 diff changeset	10 include_fr1=$6
34 d436daae9d68 Uploaded davidvanzessen parents: 32 diff changeset	11 functionality=$7
d436daae9d68 Uploaded davidvanzessen parents: 32 diff changeset	12 unique=$8
69 7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	13 naive_output_ca=$9
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	14 naive_output_cg=${10}
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	15 naive_output_cm=${11}
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	16 filter_unique=${12}
7acdcd5c52ef Uploaded davidvanzessen parents: 66 diff changeset	17 class_filter=${13}
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	18 empty_region_filter=${14}
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	19 mkdir $outdir
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	20
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	21 tar -xzf $dir/style.tar.gz -C $outdir
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	22
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	23 echo "---------------- read parameters ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	24 echo "---------------- read parameters ----------------<br />" > $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	25
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	26 echo "unpacking IMGT file"
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	27
35 8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	28 type="`file $input`"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	29 if [[ "$type" == "Zip archive" ]] ; then
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	30 echo "Zip archive"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	31 echo "unzip $input -d $PWD/files/"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	32 unzip $input -d $PWD/files/
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	33 elif [[ "$type" == "XZ compressed data" ]] ; then
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	34 echo "ZX archive"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	35 echo "tar -xJf $input -C $PWD/files/"
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	36 mkdir -p $PWD/files/$title
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	37 tar -xJf $input -C $PWD/files/$title
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	38 fi
8dba36531e6e Uploaded davidvanzessen parents: 34 diff changeset	39
64 0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	40 cat `find $PWD/files/ -name "1_*"` > $PWD/summary.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	41 cat `find $PWD/files/ -name "3_*"` > $PWD/sequences.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	42 cat `find $PWD/files/ -name "5_*"` > $PWD/aa.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	43 cat `find $PWD/files/ -name "6_*"` > $PWD/junction.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	44 cat `find $PWD/files/ -name "7_*"` > $PWD/mutationanalysis.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	45 cat `find $PWD/files/ -name "8_*"` > $PWD/mutationstats.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	46 cat `find $PWD/files/ -name "10_*"` > $PWD/hotspots.txt
0fdd90f7c654 Uploaded davidvanzessen parents: 63 diff changeset	47
119 626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	48 if [[ ${#BLASTN_DIR} -ge 5 ]] ; then
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	49 echo "On server, using BLASTN_DIR env: ${BLASTN_DIR}"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	50 else
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	51 BLASTN_DIR="/home/galaxy/Downloads/ncbi-blast-2.4.0+/bin"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	52 echo "Dev Galaxy set BLASTN_DIR to: ${BLASTN_DIR}"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	53 fi
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	54
89 480fdd383fdb Uploaded davidvanzessen parents: 85 diff changeset	55 echo "---------------- identification ($method) ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	56 echo "---------------- identification ($method) ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	57
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	58 if [[ "${method}" == "custom" ]] ; then
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	59 python $dir/gene_identification.py --input $PWD/summary.txt --output $outdir/identified_genes.txt
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	60 else
119 626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	61 echo "---------------- summary_to_fasta.py ----------------"
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	62 echo "---------------- summary_to_fasta.py ----------------<br />" >> $log
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	63
119 626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	64 python $dir/summary_to_fasta.py --input $PWD/summary.txt --fasta $PWD/sequences.fasta
626a956f3811 Uploaded davidvanzessen parents: 117 diff changeset	65
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	66 echo -e "qseqid\tsseqid\tpident\tlength\tmismatch\tgapopen\tqstart\tqend\tsstart\tsend\tevalue\tbitscore" > $outdir/identified_genes.txt
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	67 ${BLASTN_DIR}/blastn -task blastn -db $dir/subclass_definition.db -query $PWD/sequences.fasta -outfmt 6 >> $outdir/identified_genes.txt
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	68 fi
c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	69
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	70 echo "---------------- merge_and_filter.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	71 echo "---------------- merge_and_filter.r ----------------<br />" >> $log
19 c518cf0d4adb Uploaded davidvanzessen parents: 16 diff changeset	72
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	73 Rscript $dir/merge_and_filter.r $PWD/summary.txt $PWD/sequences.txt $PWD/mutationanalysis.txt $PWD/mutationstats.txt $PWD/hotspots.txt $outdir/identified_genes.txt $outdir/merged.txt $outdir/before_unique_filter.txt $outdir/unmatched.txt $method $functionality $unique ${filter_unique} ${class_filter} ${empty_region_filter} 2>&1
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	74
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 95 diff changeset	75 echo "---------------- creating new IMGT zip ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	76 echo "---------------- creating new IMGT zip ----------------<br />" >> $log
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	77
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	78 mkdir $outdir/new_IMGT
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	79
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	80 cat `find $PWD/files/ -name "1_*"` > "$outdir/new_IMGT/1_Summary.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	81 cat `find $PWD/files/ -name "2_*"` > "$outdir/new_IMGT/2_IMGT-gapped-nt-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	82 cat `find $PWD/files/ -name "3_*"` > "$outdir/new_IMGT/3_Nt-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	83 cat `find $PWD/files/ -name "4_*"` > "$outdir/new_IMGT/4_IMGT-gapped-AA-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	84 cat `find $PWD/files/ -name "5_*"` > "$outdir/new_IMGT/5_AA-sequences.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	85 cat `find $PWD/files/ -name "6_*"` > "$outdir/new_IMGT/6_Junction.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	86 cat `find $PWD/files/ -name "7_*"` > "$outdir/new_IMGT/7_V-REGION-mutation-and-AA-change-table.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	87 cat `find $PWD/files/ -name "8_*"` > "$outdir/new_IMGT/8_V-REGION-nt-mutation-statistics.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	88 cat `find $PWD/files/ -name "9_*"` > "$outdir/new_IMGT/9_V-REGION-AA-change-statistics.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	89 cat `find $PWD/files/ -name "10_*"` > "$outdir/new_IMGT/10_V-REGION-mutation-hotspots.txt"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	90
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	91 mkdir $outdir/new_IMGT_ca
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	92 cp $outdir/new_IMGT/* $outdir/new_IMGT_ca
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	93
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	94 mkdir $outdir/new_IMGT_ca1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	95 cp $outdir/new_IMGT/* $outdir/new_IMGT_ca1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	96
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	97 mkdir $outdir/new_IMGT_ca2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	98 cp $outdir/new_IMGT/* $outdir/new_IMGT_ca2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	99
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	100 mkdir $outdir/new_IMGT_cg
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	101 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	102
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	103 mkdir $outdir/new_IMGT_cg1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	104 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	105
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	106 mkdir $outdir/new_IMGT_cg2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	107 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg2
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	108
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	109 mkdir $outdir/new_IMGT_cg3
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	110 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg3
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	111
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	112 mkdir $outdir/new_IMGT_cg4
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	113 cp $outdir/new_IMGT/* $outdir/new_IMGT_cg4
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	114
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	115 mkdir $outdir/new_IMGT_cm
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	116 cp $outdir/new_IMGT/* $outdir/new_IMGT_cm
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	117
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	118 Rscript $dir/new_imgt.r $outdir/new_IMGT/ $outdir/merged.txt "-" 2>&1
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	119
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	120 Rscript $dir/new_imgt.r $outdir/new_IMGT_ca/ $outdir/merged.txt "ca" 2>&1
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	121 Rscript $dir/new_imgt.r $outdir/new_IMGT_ca1/ $outdir/merged.txt "ca1" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	122 Rscript $dir/new_imgt.r $outdir/new_IMGT_ca2/ $outdir/merged.txt "ca2" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	123
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	124 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg/ $outdir/merged.txt "cg" 2>&1
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	125 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg1/ $outdir/merged.txt "cg1" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	126 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg2/ $outdir/merged.txt "cg2" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	127 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg3/ $outdir/merged.txt "cg3" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	128 Rscript $dir/new_imgt.r $outdir/new_IMGT_cg4/ $outdir/merged.txt "cg4" 2>&1
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	129
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	130 Rscript $dir/new_imgt.r $outdir/new_IMGT_cm/ $outdir/merged.txt "cm" 2>&1
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	131
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	132
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	133 tmp="$PWD"
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	134 cd $outdir/new_IMGT/ #tar weirdness...
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	135 tar -cJf ../new_IMGT.txz *
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	136
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	137 cd $outdir/new_IMGT_ca/
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	138 tar -cJf ../new_IMGT_ca.txz *
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	139
117 a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	140 cd $outdir/new_IMGT_ca1/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	141 tar -cJf ../new_IMGT_ca1.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	142
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	143 cd $outdir/new_IMGT_ca2/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	144 tar -cJf ../new_IMGT_ca2.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	145
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	146 cd $outdir/new_IMGT_cg/
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	147 tar -cJf ../new_IMGT_cg.txz *
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	148
117 a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	149 cd $outdir/new_IMGT_cg1/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	150 tar -cJf ../new_IMGT_cg1.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	151
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	152 cd $outdir/new_IMGT_cg2/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	153 tar -cJf ../new_IMGT_cg2.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	154
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	155 cd $outdir/new_IMGT_cg3/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	156 tar -cJf ../new_IMGT_cg3.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	157
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	158 cd $outdir/new_IMGT_cg4/
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	159 tar -cJf ../new_IMGT_cg4.txz *
a8f91c52411c Uploaded davidvanzessen parents: 116 diff changeset	160
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	161 cd $outdir/new_IMGT_cm/
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	162 tar -cJf ../new_IMGT_cm.txz *
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	163
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	164 cd $tmp
a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	165
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	166 echo "---------------- mutation_analysis.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	167 echo "---------------- mutation_analysis.r ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	168
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	169 classes="ca,ca1,ca2,cg,cg1,cg2,cg3,cg4,cm,unmatched"
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	170 echo "R mutation analysis"
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	171 Rscript $dir/mutation_analysis.r $outdir/merged.txt $classes $outdir ${include_fr1} 2>&1
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	172
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	173
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	174 echo "---------------- mutation_analysis.py ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	175 echo "---------------- mutation_analysis.py ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	176
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	177 python $dir/mutation_analysis.py --input $outdir/merged.txt --genes $classes --includefr1 "${include_fr1}" --output $outdir/hotspot_analysis.txt
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	178
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	179 echo "---------------- aa_histogram.r ----------------"
105 e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	180 echo "---------------- aa_histogram.r ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	181
107 01c9993865af Uploaded davidvanzessen parents: 105 diff changeset	182 Rscript $dir/aa_histogram.r $outdir/aa_id_mutations.txt $outdir/absent_aa_id.txt "ca,cg,cm" $outdir/ 2>&1
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	183 if [ -e "$outdir/aa_histogram_.png" ]; then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	184 mv $outdir/aa_histogram_.png $outdir/aa_histogram.png
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	185 mv $outdir/aa_histogram_.txt $outdir/aa_histogram.txt
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	186 fi
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	187
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	188 genes=(ca ca1 ca2 cg cg1 cg2 cg3 cg4 cm)
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	189
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	190 funcs=(sum mean median)
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	191 funcs=(sum)
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	192
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	193 echo "---------------- sequence_overview.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	194 echo "---------------- sequence_overview.r ----------------<br />" >> $log
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	195
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	196 mkdir $outdir/sequence_overview
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	197
100 ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	198 Rscript $dir/sequence_overview.r $outdir/before_unique_filter.txt $outdir/merged.txt $outdir/sequence_overview $classes $outdir/hotspot_analysis_sum.txt 2>&1
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	199
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	200 echo "<table border='1'>" > $outdir/base_overview.html
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	201
92 b869a126e2c4 Uploaded davidvanzessen parents: 90 diff changeset	202 while IFS=$'\t' read ID class seq A C G T
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	203 do
85 07f7da724a77 Uploaded davidvanzessen parents: 84 diff changeset	204 echo "<tr><td>$ID</td><td>$seq</td><td>$class</td><td>$A</td><td>$C</td><td>$G</td><td>$T</td></tr>" >> $outdir/base_overview.html
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	205 done < $outdir/sequence_overview/ntoverview.txt
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	206
62 4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	207 echo "<html><center><h1>$title</h1></center>" > $output
121 31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	208 echo "<meta name='viewport' content='width=device-width, initial-scale=1'>" >> $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	209 echo "<script type='text/javascript' src='jquery-1.11.0.min.js'></script>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	210 echo "<script type='text/javascript' src='tabber.js'></script>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	211 echo "<script type='text/javascript' src='script.js'></script>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	212 echo "<link rel='stylesheet' type='text/css' href='style.css'>" >> $output
122 3d64b3efd352 Uploaded davidvanzessen parents: 121 diff changeset	213 echo "<link rel='stylesheet' type='text/css' href='pure-min.css'>" >> $output
62 4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	214
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 95 diff changeset	215 matched_count="`cat $outdir/merged.txt \| grep -v 'unmatched' \| tail -n +2 \| wc -l`"
62 4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	216 unmatched_count="`cat $outdir/unmatched.txt \| tail -n +2 \| wc -l`"
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	217 total_count=$((matched_count + unmatched_count))
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	218 perc_count=$((unmatched_count / total_count * 100))
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	219 perc_count=`bc -l <<< "scale=2; ${unmatched_count} / ${total_count} * 100"`
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	220 perc_count=`bc -l <<< "scale=2; (${unmatched_count} / ${total_count} * 100 ) / 1"`
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	221
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	222 echo "<center><h2>Total: ${total_count}</h2></center>" >> $output
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	223 echo "<center><h2>Matched: ${matched_count} Unmatched: ${unmatched_count}</h2></center>" >> $output
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	224 echo "<center><h2>Percentage unmatched: ${perc_count}</h2></center>" >> $output
4262e880472d Uploaded davidvanzessen parents: 58 diff changeset	225
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	226 echo "---------------- main tables ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	227 echo "---------------- main tables ----------------<br />" >> $log
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	228
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	229 echo "<div class='tabber'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	230 echo "<div class='tabbertab' title='SHM Overview'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	231
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	232 for func in ${funcs[@]}
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	233 do
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	234
0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	235 echo "---------------- $func table ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	236 echo "---------------- $func table ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	237
94 e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	238 cat $outdir/mutations_${func}.txt $outdir/hotspot_analysis_${func}.txt > $outdir/data_${func}.txt
123 0453ea4d9f14 Uploaded davidvanzessen parents: 122 diff changeset	239
121 31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	240 echo "<table class='pure-table pure-table-striped'>" >> $output
31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	241 echo "<thead><tr><th>info</th>" >> $output
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	242 for gene in ${genes[@]}
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	243 do
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	244 tmp=`cat $outdir/${gene}_${func}_n.txt`
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	245 echo "<th><a href='matched_${gene}_${func}.txt'>${gene} (N = $tmp)</a></th>" >> $output
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	246 done
78 b523ce95d857 Uploaded davidvanzessen parents: 77 diff changeset	247
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	248 tmp=`cat $outdir/all_${func}_n.txt`
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	249 echo "<th><a href='matched_all_${func}.txt'>all (N = $tmp)</a></th>" >> $output
78 b523ce95d857 Uploaded davidvanzessen parents: 77 diff changeset	250 tmp=`cat $outdir/unmatched_${func}_n.txt`
121 31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	251 echo "<th><a href='unmatched.txt'>unmatched (N = ${unmatched_count})</a></th><tr></thead>" >> $output
4 069419cccba4 Uploaded davidvanzessen parents: 3 diff changeset	252
78 b523ce95d857 Uploaded davidvanzessen parents: 77 diff changeset	253 while IFS=, read name cax cay caz ca1x ca1y ca1z ca2x ca2y ca2z cgx cgy cgz cg1x cg1y cg1z cg2x cg2y cg2z cg3x cg3y cg3z cg4x cg4y cg4z cmx cmy cmz unx uny unz allx ally allz
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	254 do
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	255 if [ "$name" == "FR S/R (ratio)" ] \|\| [ "$name" == "CDR S/R (ratio)" ] ; then #meh
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	256 echo "<tr><td>$name</td><td>${cax}/${cay} (${caz})</td><td>${ca1x}/${ca1y} (${ca1z})</td><td>${ca2x}/${ca2y} (${ca2z})</td><td>${cgx}/${cgy} (${cgz})</td><td>${cg1x}/${cg1y} (${cg1z})</td><td>${cg2x}/${cg2y} (${cg2z})</td><td>${cg3x}/${cg3y} (${cg3z})</td><td>${cg4x}/${cg4y} (${cg4z})</td><td>${cmx}/${cmy} (${cmz})</td><td>${allx}/${ally} (${allz})</td></tr>" >> $output
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	257 else
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	258 echo "<tr><td>$name</td><td>${cax}/${cay} (${caz}%)</td><td>${ca1x}/${ca1y} (${ca1z}%)</td><td>${ca2x}/${ca2y} (${ca2z}%)</td><td>${cgx}/${cgy} (${cgz}%)</td><td>${cg1x}/${cg1y} (${cg1z}%)</td><td>${cg2x}/${cg2y} (${cg2z}%)</td><td>${cg3x}/${cg3y} (${cg3z}%)</td><td>${cg4x}/${cg4y} (${cg4z}%)</td><td>${cmx}/${cmy} (${cmz}%)</td><td>${allx}/${ally} (${allz}%)</td><td>${unx}/${uny} (${unz}%)</td></tr>" >> $output
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	259 fi
94 e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	260 done < $outdir/data_${func}.txt
e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	261 echo "</table>" >> $output
e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	262 #echo "<a href='data_${func}.txt'>Download data</a>" >> $output
53 7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	263 done
7290a88ea202 Uploaded davidvanzessen parents: 52 diff changeset	264
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	265 echo "</div>" >> $output #SHM overview tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	266
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	267 echo "---------------- images ----------------"
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	268 echo "---------------- images ----------------<br />" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	269
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	270 echo "<div class='tabbertab' title='SHM Frequency'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	271
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	272 if [ -a $outdir/scatter.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	273 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	274 echo "<img src='scatter.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	275 echo "<a href='scatter.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	276 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	277 if [ -a $outdir/frequency_ranges.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	278 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	279 echo "<img src='frequency_ranges.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	280 echo "<a href='frequency_ranges_classes.txt'>download class data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	281 echo "<a href='frequency_ranges_subclasses.txt'>download subclass data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	282 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	283
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	284 echo "</div>" >> $output #SHM frequency tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	285
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	286 echo "<div class='tabbertab' title='Transition tables'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	287
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	288 echo "<table border='0'>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	289
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	290 for gene in ${genes[@]}
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	291 do
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	292 echo "<tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	293 echo "<td><h1>${gene}</h1></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	294 echo "<td><img src='transitions_heatmap_${gene}.png' /></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	295 echo "<td><img src='transitions_stacked_${gene}.png' /></td>" >> $output
121 31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	296 echo "<td><table class='pure-table transition-table pure-table-bordered'>" >> $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	297 while IFS=, read from a c g t
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	298 do
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	299 echo "<tr><td>$from</td><td>$a</td><td>$c</td><td>$g</td><td>$t</td></tr>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	300 done < $outdir/transitions_${gene}_sum.txt
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	301 echo "</table></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	302
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	303 echo "</tr>" >> $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	304 done
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	305
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	306 echo "<tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	307 echo "<td><h1>All</h1></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	308 echo "<td><img src='transitions_heatmap_all.png' /></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	309 echo "<td><img src='transitions_stacked_all.png' /></td>" >> $output
121 31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	310 echo "<td><table class='pure-table transition-table pure-table-bordered'>" >> $output
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	311 while IFS=, read from a c g t
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	312 do
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	313 echo "<tr><td>$from</td><td>$a</td><td>$c</td><td>$g</td><td>$t</td></tr>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	314 done < $outdir/transitions_all_sum.txt
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	315 echo "</table></td>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	316
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	317 echo "</tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	318
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	319 echo "</table>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	320
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	321 echo "</div>" >> $output #transition tables tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	322
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	323 echo "<div class='tabbertab' title='Antigen Selection'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	324
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	325 if [ -a $outdir/aa_histogram.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	326 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	327 echo "<img src='aa_histogram.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	328 echo "<a href='aa_histogram.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	329 echo "<img src='aa_histogram_ca.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	330 echo "<a href='aa_histogram_ca.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	331 echo "<img src='aa_histogram_cg.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	332 echo "<a href='aa_histogram_cg.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	333 echo "<img src='aa_histogram_cm.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	334 echo "<a href='aa_histogram_cm.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	335 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	336
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	337 echo "<embed src='baseline_ca.pdf' width='700px' height='1000px'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	338 echo "<embed src='baseline_cg.pdf' width='700px' height='1000px'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	339 echo "<embed src='baseline_cm.pdf' width='700px' height='1000px'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	340
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	341 echo "</div>" >> $output #antigen selection tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	342
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	343 echo "<div class='tabbertab' title='CSR'>" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	344
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	345 if [ -a $outdir/ca.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	346 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	347 echo "<img src='ca.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	348 echo "<a href='ca.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	349 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	350 if [ -a $outdir/cg.png ]
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	351 then
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	352 echo "<img src='cg.png'/><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	353 echo "<a href='cg.txt'>download data</a><br />" >> $output
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	354 fi
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	355
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	356 echo "</div>" >> $output #CSR tab end
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	357
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	358 echo "<div class='tabbertab' title='Downloads'>" >> $output
94 e39176ccddc8 Uploaded davidvanzessen parents: 92 diff changeset	359
121 31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	360 echo "<table class='pure-table pure-table-striped'>" >> $output
31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	361 echo "<thead><tr><th>info</th><th>link</th></tr></thead>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	362 echo "<tr><td>The complete dataset</td><td><a href='merged.txt'>Download</a></td></tr>" >> $output
123 0453ea4d9f14 Uploaded davidvanzessen parents: 122 diff changeset	363 echo "<tr><td>The SHM Overview table as a dataset</td><td><a href='data_sum.txt'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	364 echo "<tr><td>The alignment info on the unmatched sequences</td><td><a href='unmatched.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	365 echo "<tr><td>Motif data per sequence ID</td><td><a href='motif_per_seq.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	366 echo "<tr><td>Mutation data per sequence ID</td><td><a href='mutation_by_id.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	367 echo "<tr><td>AA mutation data per sequence ID</td><td><a href='aa_id_mutations.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	368 echo "<tr><td>Absent AA location data per sequence ID</td><td><a href='absent_aa_id.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	369 echo "<tr><td>CDR1+FR2+CDR2+FR3+CDR3 sequences that show up more than once</td><td><a href='sequence_overview/index.html'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	370 echo "<tr><td>Base count for every sequence</td><td><a href='base_overview.html'>Download</a></td></tr>" >> $output
121 31cca6d3722a Uploaded davidvanzessen parents: 120 diff changeset	371 echo "<tr><td>Baseline PDF (<a href='http://selection.med.yale.edu/baseline/'>http://selection.med.yale.edu/baseline/</a>)</td><td><a href='baseline.pdf'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	372 echo "<tr><td>Baseline data</td><td><a href='baseline.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	373 echo "<tr><td>Baseline ca PDF</td><td><a href='baseline_ca.pdf'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	374 echo "<tr><td>Baseline ca data</td><td><a href='baseline_ca.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	375 echo "<tr><td>Baseline cg PDF</td><td><a href='baseline_cg.pdf'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	376 echo "<tr><td>Baseline cg data</td><td><a href='baseline_cg.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	377 echo "<tr><td>Baseline cm PDF</td><td><a href='baseline_cm.pdf'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	378 echo "<tr><td>Baseline cm data</td><td><a href='baseline_cm.txt'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	379 echo "<tr><td>An IMGT archive with just the matched and filtered sequences</td><td><a href='new_IMGT.txz'>Download</a></td></tr>" >> $output
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	380 echo "<tr><td>An IMGT archive with just the matched and filtered ca sequences</td><td><a href='new_IMGT_ca.txz'>Download</a></td></tr>" >> $output
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	381 echo "<tr><td>An IMGT archive with just the matched and filtered ca1 sequences</td><td><a href='new_IMGT_ca1.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	382 echo "<tr><td>An IMGT archive with just the matched and filtered ca2 sequences</td><td><a href='new_IMGT_ca2.txz'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	383 echo "<tr><td>An IMGT archive with just the matched and filtered cg sequences</td><td><a href='new_IMGT_cg.txz'>Download</a></td></tr>" >> $output
116 4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	384 echo "<tr><td>An IMGT archive with just the matched and filtered cg1 sequences</td><td><a href='new_IMGT_cg1.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	385 echo "<tr><td>An IMGT archive with just the matched and filtered cg2 sequences</td><td><a href='new_IMGT_cg2.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	386 echo "<tr><td>An IMGT archive with just the matched and filtered cg3 sequences</td><td><a href='new_IMGT_cg3.txz'>Download</a></td></tr>" >> $output
4984c2a06c43 Uploaded davidvanzessen parents: 114 diff changeset	387 echo "<tr><td>An IMGT archive with just the matched and filtered cg4 sequences</td><td><a href='new_IMGT_cg4.txz'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	388 echo "<tr><td>An IMGT archive with just the matched and filtered cm sequences</td><td><a href='new_IMGT_cm.txz'>Download</a></td></tr>" >> $output
120 613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	389 echo "<tr><td>The Change-O DB file with defined clones</td><td><a href='change_o/change-o-db-defined_clones.txt'>Download</a></td></tr>" >> $output
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	390 echo "<tr><td>The Change-O DB defined clones summary file</td><td><a href='change_o/change-o-defined_clones-summary.txt'>Download</a></td></tr>" >> $output
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	391 echo "</table>" >> $output
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	392
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	393 echo "</div>" >> $output #downloads tab end
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	394
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	395 echo "</div>" >> $output #tabs end
0 74d2bc479bee Uploaded davidvanzessen parents: diff changeset	396
74d2bc479bee Uploaded davidvanzessen parents: diff changeset	397 echo "</html>" >> $output
2 2f4298673519 Uploaded davidvanzessen parents: 1 diff changeset	398
95 a66eb1c5374c Uploaded davidvanzessen parents: 94 diff changeset	399 echo "---------------- baseline ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	400 echo "---------------- baseline ----------------<br />" >> $log
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	401 tmp="$PWD"
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	402
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	403 mkdir $outdir/baseline
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	404
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	405
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	406 mkdir $outdir/baseline/ca_cg_cm
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	407 if [[ $(wc -l < $outdir/new_IMGT/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	408 cd $outdir/baseline/ca_cg_cm
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	409 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT.txz "ca_cg_cm" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline.pdf" "Sequence.ID" "$outdir/baseline.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	410 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	411 echo "No sequences" > "$outdir/baseline.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	412 fi
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	413
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	414 mkdir $outdir/baseline/ca
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	415 if [[ $(wc -l < $outdir/new_IMGT_ca/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	416 cd $outdir/baseline/ca
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	417 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT_ca.txz "ca" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline_ca.pdf" "Sequence.ID" "$outdir/baseline_ca.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	418 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	419 echo "No ca sequences" > "$outdir/baseline_ca.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	420 fi
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	421
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	422 mkdir $outdir/baseline/cg
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	423 if [[ $(wc -l < $outdir/new_IMGT_cg/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	424 cd $outdir/baseline/cg
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	425 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT_cg.txz "cg" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline_cg.pdf" "Sequence.ID" "$outdir/baseline_cg.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	426 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	427 echo "No cg sequences" > "$outdir/baseline_cg.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	428 fi
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	429
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	430 mkdir $outdir/baseline/cm
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	431 if [[ $(wc -l < $outdir/new_IMGT_cm/1_Summary.txt) -gt "1" ]]; then
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	432 cd $outdir/baseline/cm
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	433 bash $dir/baseline/wrapper.sh 1 1 1 1 0 0 "25:26:38:55:65:104:-" $outdir/new_IMGT_cm.txz "cm" "$dir/baseline/IMGT-reference-seqs-IGHV-2015-11-05.fa" "$outdir/baseline_cm.pdf" "Sequence.ID" "$outdir/baseline_cm.txt"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	434 else
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	435 echo "No cm sequences" > "$outdir/baseline_cm.txt"
e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	436 fi
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	437
101 3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	438 cd $tmp
3cffb8a38bb1 Uploaded davidvanzessen parents: 100 diff changeset	439
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	440 echo "---------------- naive_output.r ----------------"
102 e6bc976760d4 Uploaded davidvanzessen parents: 101 diff changeset	441 echo "---------------- naive_output.r ----------------<br />" >> $log
55 0d5add1a9800 Uploaded davidvanzessen parents: 54 diff changeset	442
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	443 if [[ "$naive_output" != "None" ]]
099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	444 then
114 e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	445 cp $outdir/new_IMGT_ca.txz ${naive_output_ca}
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	446 cp $outdir/new_IMGT_cg.txz ${naive_output_cg}
e7b550d52eb7 Uploaded davidvanzessen parents: 110 diff changeset	447 cp $outdir/new_IMGT_cm.txz ${naive_output_cm}
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	448 fi
099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	449
81 a778156dad3d Uploaded davidvanzessen parents: 80 diff changeset	450 echo "</table>" >> $outdir/base_overview.html
a778156dad3d Uploaded davidvanzessen parents: 80 diff changeset	451
120 613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	452 echo "---------------- change-o MakeDB ----------------"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	453 echo "---------------- change-o MakeDB ----------------<br />" >> $log
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	454
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	455 mkdir $outdir/change_o
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	456
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	457 tmp="$PWD"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	458
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	459 cd $outdir/change_o
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	460
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	461 bash $dir/change_o/makedb.sh $input false false false $outdir/change_o/change-o-db.txt
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	462
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	463 echo "---------------- change-o DefineClones ----------------"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	464 echo "---------------- change-o DefineClones ----------------<br />" >> $log
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	465
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	466 bash $dir/change_o/define_clones.sh bygroup $outdir/change_o/change-o-db.txt gene first ham none min complete 3.0 $outdir/change_o/change-o-db-defined_clones.txt $outdir/change_o/change-o-defined_clones-summary.txt
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	467
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	468 PWD="$tmp"
613278c1bde0 Uploaded davidvanzessen parents: 119 diff changeset	469
105 e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	470 mv $log $outdir/log.html
e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	471
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	472 echo "<html><center><h1><a href='index.html'>Click here for the results</a></h1>Tip: Open it in a new tab (middle mouse button or right mouse button -> 'open in new tab' on the link above)<br />" > $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	473 echo "<table border = 1>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	474 echo "<thead><tr><th>Info</th><th>Sequences</th><th>Percentage</th></tr></thead>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	475 tIFS="$TMP"
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	476 IFS=$'\t'
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	477 while read step seq perc
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	478 do
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	479 echo "<tr>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	480 echo "<td>$step</td>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	481 echo "<td>$seq</td>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	482 echo "<td>${perc}%</td>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	483 echo "</tr>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	484 done < $outdir/filtering_steps.txt
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	485 echo "</table border></center></html>" >> $log
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	486
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	487 IFS="$tIFS"
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	488
105 e4957ad476a2 Uploaded davidvanzessen parents: 104 diff changeset	489
81 a778156dad3d Uploaded davidvanzessen parents: 80 diff changeset	490 echo "---------------- Done! ----------------"
107 01c9993865af Uploaded davidvanzessen parents: 105 diff changeset	491 echo "---------------- Done! ----------------<br />" >> $outdir/log.html
47 099cc1254f74 Uploaded davidvanzessen parents: 43 diff changeset	492
110 ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	493
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	494
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	495
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	496
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	497
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	498
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	499
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	500
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	501
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	502
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	503
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	504
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	505
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	506
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	507
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	508
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	509
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	510
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	511
ade5cf6fd2dc Uploaded davidvanzessen parents: 108 diff changeset	512

Mercurial > repos > davidvanzessen > mutation_analysis

annotate wrapper.sh @ 123:0453ea4d9f14 draft