mutation_analysis: sequence_overview.r annotate

annotate sequence_overview.r @ 103:e21cbe15381f draft

Uploaded

author	davidvanzessen
date	Tue, 21 Jun 2016 05:30:16 -0400
parents	e6bc976760d4
children	603a10976e9c

rev	line source
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	1 library(reshape2)
becea91089ed Uploaded davidvanzessen parents: diff changeset	2
becea91089ed Uploaded davidvanzessen parents: diff changeset	3 args <- commandArgs(trailingOnly = TRUE)
becea91089ed Uploaded davidvanzessen parents: diff changeset	4
100 ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	5 before.unique.file = args[1]
ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	6 merged.file = args[2]
ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	7 outputdir = args[3]
ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	8 gene.classes = unlist(strsplit(args[4], ","))
ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	9 hotspot.analysis.sum.file = args[5]
81 a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	10 NToverview.file = paste(outputdir, "ntoverview.txt", sep="/")
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	11 NTsum.file = paste(outputdir, "ntsum.txt", sep="/")
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	12 main.html = "index.html"
becea91089ed Uploaded davidvanzessen parents: diff changeset	13
becea91089ed Uploaded davidvanzessen parents: diff changeset	14 setwd(outputdir)
becea91089ed Uploaded davidvanzessen parents: diff changeset	15
100 ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	16 before.unique = read.table(before.unique.file, header=T, sep="\t", fill=T, stringsAsFactors=F, quote="")
ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	17 merged = read.table(merged.file, header=T, sep="\t", fill=T, stringsAsFactors=F, quote="")
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	18 hotspot.analysis.sum = read.table(hotspot.analysis.sum.file, header=F, sep=",", fill=T, stringsAsFactors=F, quote="")
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	19
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	20 #before.unique = before.unique[!grepl("unmatched", before.unique$best_match),]
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	21
100 ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	22 before.unique$seq_conc = paste(before.unique$CDR1.IMGT.seq, before.unique$FR2.IMGT.seq, before.unique$CDR2.IMGT.seq, before.unique$FR3.IMGT.seq, before.unique$CDR3.IMGT.seq)
ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	23
ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	24 IDs = before.unique[,c("Sequence.ID", "seq_conc", "best_match", "Functionality")]
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	25 IDs$best_match = as.character(IDs$best_match)
becea91089ed Uploaded davidvanzessen parents: diff changeset	26
becea91089ed Uploaded davidvanzessen parents: diff changeset	27 #dat = data.frame(data.table(dat)[, list(freq=.N), by=c("best_match", "seq_conc")])
becea91089ed Uploaded davidvanzessen parents: diff changeset	28
100 ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	29 dat = data.frame(table(before.unique$seq_conc))
91 5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	30 #dat = data.frame(table(merged$seq_conc, merged$Functionality))
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	31
87 fd63f5307962 Uploaded davidvanzessen parents: 86 diff changeset	32 #dat = dat[dat$Freq > 1,]
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	33
91 5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	34 #names(dat) = c("seq_conc", "Functionality", "Freq")
5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	35 names(dat) = c("seq_conc", "Freq")
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	36
becea91089ed Uploaded davidvanzessen parents: diff changeset	37 dat$seq_conc = factor(dat$seq_conc)
becea91089ed Uploaded davidvanzessen parents: diff changeset	38
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	39 dat = dat[order(as.character(dat$seq_conc)),]
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	40
becea91089ed Uploaded davidvanzessen parents: diff changeset	41 #writing html from R...
becea91089ed Uploaded davidvanzessen parents: diff changeset	42 td = function(val) { paste("<td>", val, "</td>", sep="") }
becea91089ed Uploaded davidvanzessen parents: diff changeset	43 tr = function(val) { capture.output(cat("<tr>", td(val), "</tr>", sep="")) }
becea91089ed Uploaded davidvanzessen parents: diff changeset	44 make.link = function(id, clss, val) { paste("<a href='", clss, "_", id, ".html'>", val, "</a>", sep="") }
becea91089ed Uploaded davidvanzessen parents: diff changeset	45 tbl = function(df) { res = "<table border='1'>"; for(i in 1:nrow(df)){ res = paste(res, tr(df[i,]), sep=""); }; res = paste(res, "</table>"); }
becea91089ed Uploaded davidvanzessen parents: diff changeset	46
becea91089ed Uploaded davidvanzessen parents: diff changeset	47 cat("<table border='1'>", file=main.html, append=F)
88 d57c624a9aa9 Uploaded davidvanzessen parents: 87 diff changeset	48 cat("<caption>CDR1+FR2+CDR2+FR3+CDR3 sequences that show up more than once</caption>", file=main.html, append=T)
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	49 cat("<tr><th>Sequence</th><th>Functionality</th><th>ca1</th><th>ca2</th><th>cg1</th><th>cg2</th><th>cg3</th><th>cg4</th><th>cm</th><th>un</th></tr>", file=main.html, append=T)
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	50
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	51
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	52
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	53 single.sequences=0 #sequence only found once, skipped
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	54 in.multiple=0 #same sequence across multiple subclasses
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	55 multiple.in.one=0 #same sequence multiple times in one subclass
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	56 unmatched=0 #all of the sequences are unmatched
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	57 some.unmatched=0 #one or more sequences in a clone are unmatched
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	58 matched=0 #should be the same als matched sequences
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	59
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	60 sequence.id.page="by_id.html"
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	61
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	62 for(i in 1:nrow(dat)){
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 94 diff changeset	63
91 5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	64 ca1 = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^ca1", IDs$best_match),]
5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	65 ca2 = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^ca2", IDs$best_match),]
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	66
91 5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	67 cg1 = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^cg1", IDs$best_match),]
5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	68 cg2 = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^cg2", IDs$best_match),]
5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	69 cg3 = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^cg3", IDs$best_match),]
5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	70 cg4 = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^cg4", IDs$best_match),]
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	71
91 5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	72 cm = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^cm", IDs$best_match),]
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	73
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	74 un = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & grepl("^unmatched", IDs$best_match),]
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	75 allc = rbind(ca1, ca2, cg1, cg2, cg3, cg4, cm, un)
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	76
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	77 classes = c(nrow(ca1), nrow(ca2), nrow(cg1), nrow(cg2), nrow(cg3), nrow(cg4), nrow(cm), nrow(un))
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	78
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	79 classes.sum = sum(classes)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	80
87 fd63f5307962 Uploaded davidvanzessen parents: 86 diff changeset	81 if(classes.sum == 1){
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	82 single.sequences = single.sequences + 1
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	83 next
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	84 }
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	85
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	86 if(nrow(un) == classes.sum){
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	87 unmatched = unmatched + 1
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	88 next
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	89 }
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	90
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	91 matched = matched + sum(classes > 0) #count in how many subclasses the sequence occurs.
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	92
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	93 if(any(classes == classes.sum)){
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	94 multiple.in.one = multiple.in.one + 1
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	95 } else if (nrow(un) > 0) {
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	96 some.unmatched = some.unmatched + 1
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 94 diff changeset	97 } else {
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	98 in.multiple = in.multiple + 1
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	99 }
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	100
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	101 id = as.numeric(dat[i,"seq_conc"])
79 0513b46178c4 Uploaded davidvanzessen parents: 78 diff changeset	102
92 b869a126e2c4 Uploaded davidvanzessen parents: 91 diff changeset	103 functionality = paste(unique(allc[,"Functionality"]), collapse=",")
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	104
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	105 by.id.row = c()
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	106
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	107 if(nrow(ca1) > 0){
becea91089ed Uploaded davidvanzessen parents: diff changeset	108 cat(tbl(ca1), file=paste("ca1_", id, ".html", sep=""))
becea91089ed Uploaded davidvanzessen parents: diff changeset	109 }
becea91089ed Uploaded davidvanzessen parents: diff changeset	110
becea91089ed Uploaded davidvanzessen parents: diff changeset	111 if(nrow(ca2) > 0){
becea91089ed Uploaded davidvanzessen parents: diff changeset	112 cat(tbl(ca2), file=paste("ca2_", id, ".html", sep=""))
becea91089ed Uploaded davidvanzessen parents: diff changeset	113 }
becea91089ed Uploaded davidvanzessen parents: diff changeset	114
becea91089ed Uploaded davidvanzessen parents: diff changeset	115 if(nrow(cg1) > 0){
becea91089ed Uploaded davidvanzessen parents: diff changeset	116 cat(tbl(cg1), file=paste("cg1_", id, ".html", sep=""))
becea91089ed Uploaded davidvanzessen parents: diff changeset	117 }
becea91089ed Uploaded davidvanzessen parents: diff changeset	118
becea91089ed Uploaded davidvanzessen parents: diff changeset	119 if(nrow(cg2) > 0){
becea91089ed Uploaded davidvanzessen parents: diff changeset	120 cat(tbl(cg2), file=paste("cg2_", id, ".html", sep=""))
becea91089ed Uploaded davidvanzessen parents: diff changeset	121 }
becea91089ed Uploaded davidvanzessen parents: diff changeset	122
becea91089ed Uploaded davidvanzessen parents: diff changeset	123 if(nrow(cg3) > 0){
becea91089ed Uploaded davidvanzessen parents: diff changeset	124 cat(tbl(cg3), file=paste("cg3_", id, ".html", sep=""))
becea91089ed Uploaded davidvanzessen parents: diff changeset	125 }
becea91089ed Uploaded davidvanzessen parents: diff changeset	126
becea91089ed Uploaded davidvanzessen parents: diff changeset	127 if(nrow(cg4) > 0){
becea91089ed Uploaded davidvanzessen parents: diff changeset	128 cat(tbl(cg4), file=paste("cg4_", id, ".html", sep=""))
becea91089ed Uploaded davidvanzessen parents: diff changeset	129 }
becea91089ed Uploaded davidvanzessen parents: diff changeset	130
becea91089ed Uploaded davidvanzessen parents: diff changeset	131 if(nrow(cm) > 0){
becea91089ed Uploaded davidvanzessen parents: diff changeset	132 cat(tbl(cm), file=paste("cm_", id, ".html", sep=""))
becea91089ed Uploaded davidvanzessen parents: diff changeset	133 }
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	134
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	135 if(nrow(un) > 0){
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	136 cat(tbl(un), file=paste("un_", id, ".html", sep=""))
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	137 }
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	138
becea91089ed Uploaded davidvanzessen parents: diff changeset	139 ca1.html = make.link(id, "ca1", nrow(ca1))
becea91089ed Uploaded davidvanzessen parents: diff changeset	140 ca2.html = make.link(id, "ca2", nrow(ca2))
becea91089ed Uploaded davidvanzessen parents: diff changeset	141
becea91089ed Uploaded davidvanzessen parents: diff changeset	142 cg1.html = make.link(id, "cg1", nrow(cg1))
becea91089ed Uploaded davidvanzessen parents: diff changeset	143 cg2.html = make.link(id, "cg2", nrow(cg2))
becea91089ed Uploaded davidvanzessen parents: diff changeset	144 cg3.html = make.link(id, "cg3", nrow(cg3))
becea91089ed Uploaded davidvanzessen parents: diff changeset	145 cg4.html = make.link(id, "cg4", nrow(cg4))
becea91089ed Uploaded davidvanzessen parents: diff changeset	146
becea91089ed Uploaded davidvanzessen parents: diff changeset	147 cm.html = make.link(id, "cm", nrow(cm))
becea91089ed Uploaded davidvanzessen parents: diff changeset	148
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	149 un.html = make.link(id, "un", nrow(un))
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	150
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	151 #rw = c(as.character(dat[i,"seq_conc"]), functionality, ca1.html, ca2.html, cg1.html, cg2.html, cg3.html, cg4.html, cm.html, un.html)
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	152 rw = c(as.character(dat[i,"seq_conc"]), functionality, ca1.html, ca2.html, cg1.html, cg2.html, cg3.html, cg4.html, cm.html, un.html)
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	153
becea91089ed Uploaded davidvanzessen parents: diff changeset	154 cat(tr(rw), file=main.html, append=T)
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	155
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	156
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	157 for(i in 1:nrow(allc)){ #generate html by id
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	158 html = make.link(id, allc[i,"best_match"], allc[i,"Sequence.ID"])
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	159 cat(paste(html, "<br />"), file=sequence.id.page, append=T)
e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	160 }
76 becea91089ed Uploaded davidvanzessen parents: diff changeset	161 }
becea91089ed Uploaded davidvanzessen parents: diff changeset	162
becea91089ed Uploaded davidvanzessen parents: diff changeset	163 cat("</table>", file=main.html, append=T)
81 a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	164
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	165 print(paste("Single sequences:", single.sequences))
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	166 print(paste("Sequences in multiple subclasses:", in.multiple))
86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	167 print(paste("Multiple sequences in one subclass:", multiple.in.one))
102 e6bc976760d4 Uploaded davidvanzessen parents: 100 diff changeset	168 print(paste("Matched with unmatched:", some.unmatched))
99 86206431cbb0 Uploaded davidvanzessen parents: 98 diff changeset	169 print(paste("Count that should match 'matched' sequences:", matched))
81 a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	170
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	171 #ACGT overview
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	172
103 e21cbe15381f Uploaded davidvanzessen parents: 102 diff changeset	173 NToverview = merged[!grepl("^unmatched", merged$best_match),]
100 ff5be711382b Uploaded davidvanzessen parents: 99 diff changeset	174
90 f0e8dac22c6e Uploaded davidvanzessen parents: 89 diff changeset	175 NToverview$seq = paste(NToverview$CDR1.IMGT.seq, NToverview$FR2.IMGT.seq, NToverview$CDR2.IMGT.seq, NToverview$FR3.IMGT.seq, sep="_")
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	176
81 a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	177 NToverview$A = nchar(gsub("[^Aa]", "", NToverview$seq))
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	178 NToverview$C = nchar(gsub("[^Cc]", "", NToverview$seq))
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	179 NToverview$G = nchar(gsub("[^Gg]", "", NToverview$seq))
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	180 NToverview$T = nchar(gsub("[^Tt]", "", NToverview$seq))
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	181
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	182 #Nsum = data.frame(Sequence.ID="-", best_match="Sum", seq="-", A = sum(NToverview$A), C = sum(NToverview$C), G = sum(NToverview$G), T = sum(NToverview$T))
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	183
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	184 #NToverview = rbind(NToverview, NTsum)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	185
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	186 NTresult = data.frame(nt=c("A", "C", "T", "G"))
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	187
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	188 for(clazz in gene.classes){
91 5e237c243088 Uploaded davidvanzessen parents: 90 diff changeset	189 NToverview.sub = NToverview[grepl(paste("^", clazz, sep=""), NToverview$best_match),]
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	190 new.col.x = c(sum(NToverview.sub$A), sum(NToverview.sub$C), sum(NToverview.sub$T), sum(NToverview.sub$G))
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	191 new.col.y = sum(new.col.x)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	192 new.col.z = round(new.col.x / new.col.y * 100, 2)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	193
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	194 tmp = names(NTresult)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	195 NTresult = cbind(NTresult, data.frame(new.col.x, new.col.y, new.col.z))
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	196 names(NTresult) = c(tmp, paste(clazz, c("x", "y", "z"), sep=""))
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	197 }
81 a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	198
98 5ffbf40cdd4b Uploaded davidvanzessen parents: 94 diff changeset	199 write.table(NToverview[,c("Sequence.ID", "best_match", "seq", "A", "C", "G", "T")], NToverview.file, quote=F, sep="\t", row.names=F, col.names=T)
5ffbf40cdd4b Uploaded davidvanzessen parents: 94 diff changeset	200
5ffbf40cdd4b Uploaded davidvanzessen parents: 94 diff changeset	201 NToverview = NToverview[!grepl("unmatched", NToverview$best_match),]
5ffbf40cdd4b Uploaded davidvanzessen parents: 94 diff changeset	202
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	203 new.col.x = c(sum(NToverview$A), sum(NToverview$C), sum(NToverview$T), sum(NToverview$G))
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	204 new.col.y = sum(new.col.x)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	205 new.col.z = round(new.col.x / new.col.y * 100, 2)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	206
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	207 tmp = names(NTresult)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	208 NTresult = cbind(NTresult, data.frame(new.col.x, new.col.y, new.col.z))
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	209 names(NTresult) = c(tmp, paste("all", c("x", "y", "z"), sep=""))
81 a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	210
82 564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	211 names(hotspot.analysis.sum) = names(NTresult)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	212
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	213 hotspot.analysis.sum = rbind(hotspot.analysis.sum, NTresult)
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	214
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	215 write.table(hotspot.analysis.sum, hotspot.analysis.sum.file, quote=F, sep=",", row.names=F, col.names=F, na="0")
564c4f6da203 Uploaded davidvanzessen parents: 81 diff changeset	216
81 a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	217
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	218
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	219
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	220
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	221
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	222
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	223
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	224
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	225
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	226
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	227
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	228
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	229
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	230
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	231
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	232
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	233
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	234
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	235
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	236
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	237
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	238
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	239
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	240
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	241
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	242
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	243
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	244
a778156dad3d Uploaded davidvanzessen parents: 79 diff changeset	245

Mercurial > repos > davidvanzessen > mutation_analysis

annotate sequence_overview.r @ 103:e21cbe15381f draft