mutation_analysis: sequence_overview.r comparison

comparison sequence_overview.r @ 81:a778156dad3d draft

Uploaded

author	davidvanzessen
date	Tue, 17 May 2016 04:17:38 -0400
parents	0513b46178c4
children	564c4f6da203

comparison

equal deleted inserted replaced

-:a4c2ddeadec0
+:a778156dad3d
 args <- commandArgs(trailingOnly = TRUE)
 gene.matches = args[1]
 sequence.file = args[2]
 outputdir = args[3]
+NToverview.file = paste(outputdir, "ntoverview.txt", sep="/")
+NTsum.file = paste(outputdir, "ntsum.txt", sep="/")
 main.html = "index.html"
 setwd(outputdir)
 genes = read.table(gene.matches, header=T, sep="\t", fill=T)
 IDs = dat[,c("Sequence.ID", "seq_conc", "best_match", "Functionality")]
 IDs$best_match = as.character(IDs$best_match)
 #dat = data.frame(data.table(dat)[, list(freq=.N), by=c("best_match", "seq_conc")])
-dat = data.frame(table(dat$best_match, dat$seq_conc, dat$Functionality))
+dat = data.frame(table(dat$seq_conc))
 dat = dat[dat$Freq > 1,]
-names(dat) = c("best_match", "seq_conc", "Functionality", "Freq")
+names(dat) = c("seq_conc", "Freq")
 dat$seq_conc = factor(dat$seq_conc)
 dat = dat[order(nchar(as.character(dat$seq_conc))),]
 	cat(tr(rw), file=main.html, append=T)
 }
 cat("</table>", file=main.html, append=T)
+#ACGT overview
+NToverview = genes[,c("Sequence.ID", "best_match")]
+sequences$seq = paste(sequences$CDR2.IMGT, sequences$CDR2.IMGT, sequences$FR2.IMGT, sequences$FR3.IMGT, sep="_")
+NToverview = merge(NToverview, sequences[,c("Sequence.ID", "seq")], by="Sequence.ID")
+NToverview$A = nchar(gsub("[^Aa]", "", NToverview$seq))
+NToverview$C = nchar(gsub("[^Cc]", "", NToverview$seq))
+NToverview$G = nchar(gsub("[^Gg]", "", NToverview$seq))
+NToverview$T = nchar(gsub("[^Tt]", "", NToverview$seq))
+NTsum = data.frame(Sequence.ID="-", best_match="Sum", seq="-", A = sum(NToverview$A), C = sum(NToverview$C), G = sum(NToverview$G), T = sum(NToverview$T))
+print(names(NToverview))
+print(names(NTsum))
+NToverview = rbind(NToverview, NTsum)
+write.table(NToverview, NToverview.file, quote=F, sep="\t", row.names=F, col.names=T)
+#write.table(NTsum, NTsum.file, quote=F, sep="\t", row.names=F, col.names=T)

Mercurial > repos > davidvanzessen > mutation_analysis

comparison sequence_overview.r @ 81:a778156dad3d draft