# HG changeset patch # User davidvanzessen # Date 1463052907 14400 # Node ID 0513b46178c45c5469a60cee02307dee7a873087 # Parent b523ce95d85714d7caab9377553de057ec5caf72 Uploaded diff -r b523ce95d857 -r 0513b46178c4 merge_and_filter.r --- a/merge_and_filter.r Wed May 11 10:29:33 2016 -0400 +++ b/merge_and_filter.r Thu May 12 07:35:07 2016 -0400 @@ -69,7 +69,7 @@ if(any(higher_than)){ #summ = summ[higher_than,] } -print(paste("Number of matched sequences:", nrow(summ))) +print(paste("Number of matched sequences:", sum(!grepl("^unmatched", summ$best_match)))) if(nrow(summ) == 0){ stop("No data remaining after filter") diff -r b523ce95d857 -r 0513b46178c4 mutation_analysis.xml --- a/mutation_analysis.xml Wed May 11 10:29:33 2016 -0400 +++ b/mutation_analysis.xml Thu May 12 07:35:07 2016 -0400 @@ -33,7 +33,7 @@ - + diff -r b523ce95d857 -r 0513b46178c4 sequence_overview.r --- a/sequence_overview.r Wed May 11 10:29:33 2016 -0400 +++ b/sequence_overview.r Thu May 12 07:35:07 2016 -0400 @@ -21,11 +21,11 @@ #dat = data.frame(data.table(dat)[, list(freq=.N), by=c("best_match", "seq_conc")]) -dat = data.frame(table(dat$best_match, dat$seq_conc)) +dat = data.frame(table(dat$best_match, dat$seq_conc, dat$Functionality)) dat = dat[dat$Freq > 1,] -names(dat) = c("best_match", "seq_conc", "Freq") +names(dat) = c("best_match", "seq_conc", "Functionality", "Freq") dat$seq_conc = factor(dat$seq_conc) @@ -39,7 +39,7 @@ cat("", file=main.html, append=F) cat("", file=main.html, append=T) -cat("", file=main.html, append=T) +cat("", file=main.html, append=T) for(i in 1:nrow(dat)){ ca1 = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & IDs$best_match == "ca1",] @@ -53,6 +53,8 @@ cm = IDs[IDs$seq_conc == dat[i,c("seq_conc")] & IDs$best_match == "cm",] id = as.numeric(dat[i,"seq_conc"]) + + functionality = dat[i,"Functionality"] if(nrow(ca1) > 0){ cat(tbl(ca1), file=paste("ca1_", id, ".html", sep="")) @@ -92,7 +94,7 @@ cm.html = make.link(id, "cm", nrow(cm)) - rw = c(as.character(dat[i,"seq_conc"]), ca1.html, ca2.html, cg1.html, cg2.html, cg3.html, cg4.html, cm.html) + rw = c(as.character(dat[i,"seq_conc"]), as.character(functionality), ca1.html, ca2.html, cg1.html, cg2.html, cg3.html, cg4.html, cm.html) cat(tr(rw), file=main.html, append=T) } diff -r b523ce95d857 -r 0513b46178c4 wrapper.sh --- a/wrapper.sh Wed May 11 10:29:33 2016 -0400 +++ b/wrapper.sh Thu May 12 07:35:07 2016 -0400 @@ -142,7 +142,7 @@ done tmp=`cat $outdir/unmatched_${func}_n.txt` - echo "" >> $output + echo "" >> $output tmp=`cat $outdir/all_${func}_n.txt` echo "" >> $output

CDR1+CDR2+CDR3+FR2+FR3 sequences that show up more than once
Sequence	ca1	ca2	cg1	cg2	cg3	cg4	cm
Sequence	Functionality	ca1	ca2	cg1	cg2	cg3	cg4	cm
unmatched (N = $tmp)	unmatched (N = ${unmatched_count})	all (N = $tmp)