multilocus_genotype: multilocus

annotate multilocus_genotype.R @ 7:18001e7cb199 draft

Uploaded

author	greg
date	Wed, 28 Nov 2018 13:49:18 -0500
parents	a7cce4091e80
children	d2057e183772

rev	line source
0 725b160c91f0 Uploaded greg parents: diff changeset	1 #!/usr/bin/env Rscript
725b160c91f0 Uploaded greg parents: diff changeset	2
725b160c91f0 Uploaded greg parents: diff changeset	3 suppressPackageStartupMessages(library("adegenet"))
725b160c91f0 Uploaded greg parents: diff changeset	4 suppressPackageStartupMessages(library("ape"))
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	5 suppressPackageStartupMessages(library("data.table"))
18001e7cb199 Uploaded greg parents: 4 diff changeset	6 #suppressPackageStartupMessages(library("dbplyr"))
18001e7cb199 Uploaded greg parents: 4 diff changeset	7 suppressPackageStartupMessages(library("dplyr"))
0 725b160c91f0 Uploaded greg parents: diff changeset	8 suppressPackageStartupMessages(library("ggplot2"))
725b160c91f0 Uploaded greg parents: diff changeset	9 suppressPackageStartupMessages(library("knitr"))
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	10 suppressPackageStartupMessages(library("optparse"))
a7cce4091e80 Uploaded greg parents: 3 diff changeset	11 suppressPackageStartupMessages(library("poppr"))
a7cce4091e80 Uploaded greg parents: 3 diff changeset	12 suppressPackageStartupMessages(library("RColorBrewer"))
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	13 suppressPackageStartupMessages(library("RPostgres"))
18001e7cb199 Uploaded greg parents: 4 diff changeset	14 #suppressPackageStartupMessages(library("tidyr"))
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	15 suppressPackageStartupMessages(library("vcfR"))
a7cce4091e80 Uploaded greg parents: 3 diff changeset	16 suppressPackageStartupMessages(library("vegan"))
0 725b160c91f0 Uploaded greg parents: diff changeset	17
725b160c91f0 Uploaded greg parents: diff changeset	18 option_list <- list(
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	19 make_option(c("--database_connection_string"), action="store", dest="database_connection_string", help="Corals (stag) database connection string"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	20 make_option(c("--input_affy_metadata"), action="store", dest="input_affy_metadata", help="Affymetrix 96 well plate input file"),
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	21 make_option(c("--input_pop_info"), action="store", dest="input_pop_info", help="Population information input file"),
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	22 make_option(c("--input_vcf"), action="store", dest="input_vcf", help="VCF input file"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	23 make_option(c("--output_mlg_id"), action="store", dest="output_mlg_id", help="Mlg Id data output file"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	24 make_option(c("--output_stag_db_report"), action="store", dest="output_stag_db_report", help="stag db report output file")
0 725b160c91f0 Uploaded greg parents: diff changeset	25 )
725b160c91f0 Uploaded greg parents: diff changeset	26
725b160c91f0 Uploaded greg parents: diff changeset	27 parser <- OptionParser(usage="%prog [options] file", option_list=option_list);
725b160c91f0 Uploaded greg parents: diff changeset	28 args <- parse_args(parser, positional_arguments=TRUE);
725b160c91f0 Uploaded greg parents: diff changeset	29 opt <- args$options;
725b160c91f0 Uploaded greg parents: diff changeset	30
725b160c91f0 Uploaded greg parents: diff changeset	31 get_file_path = function(file_name) {
725b160c91f0 Uploaded greg parents: diff changeset	32 file_path = paste("output_plots_dir", file_name, sep="/");
725b160c91f0 Uploaded greg parents: diff changeset	33 return(file_path);
725b160c91f0 Uploaded greg parents: diff changeset	34 }
725b160c91f0 Uploaded greg parents: diff changeset	35
3 1bc815d9c8c5 Uploaded greg parents: 2 diff changeset	36 # Read in VCF input file.
2 86aaadf36a4f Uploaded greg parents: 0 diff changeset	37 vcf <- read.vcfR(opt$input_vcf);
0 725b160c91f0 Uploaded greg parents: diff changeset	38
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	39 #Missing GT in samples submitted
a7cce4091e80 Uploaded greg parents: 3 diff changeset	40 gt <- extract.gt(vcf, element="GT", as.numeric=FALSE);
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	41 missing_gt <- apply(gt, MARGIN=2, function(x){ sum(is.na(x))});
18001e7cb199 Uploaded greg parents: 4 diff changeset	42 missing_gt <- (missing_gt / nrow(vcf)) * 100;
18001e7cb199 Uploaded greg parents: 4 diff changeset	43 missing_gt_data_frame <- data.frame(missing_gt);
18001e7cb199 Uploaded greg parents: 4 diff changeset	44
18001e7cb199 Uploaded greg parents: 4 diff changeset	45 hets <- apply(gt, MARGIN=2, function(x) {sum(lengths(regmatches(x, gregexpr("0/1", x))))} );
18001e7cb199 Uploaded greg parents: 4 diff changeset	46 hets <- (hets / nrow(vcf)) * 100;
18001e7cb199 Uploaded greg parents: 4 diff changeset	47 ht <- data.frame(hets);
18001e7cb199 Uploaded greg parents: 4 diff changeset	48
18001e7cb199 Uploaded greg parents: 4 diff changeset	49 refA <- apply(gt, MARGIN=2, function(x) {sum(lengths(regmatches(x, gregexpr("0/0", x))))} );
18001e7cb199 Uploaded greg parents: 4 diff changeset	50 refA <- (refA / nrow(vcf)) * 100;
18001e7cb199 Uploaded greg parents: 4 diff changeset	51 rA <- data.frame(refA);
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	52
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	53 altB <- apply(gt, MARGIN=2, function(x) {sum(lengths(regmatches(x, gregexpr("1/1", x))))} );
18001e7cb199 Uploaded greg parents: 4 diff changeset	54 altB <- (altB / nrow(vcf)) * 100;
18001e7cb199 Uploaded greg parents: 4 diff changeset	55 aB <- data.frame(altB);
18001e7cb199 Uploaded greg parents: 4 diff changeset	56
18001e7cb199 Uploaded greg parents: 4 diff changeset	57 # Convert VCF file into a genind for the Poppr package.
18001e7cb199 Uploaded greg parents: 4 diff changeset	58 # TODO: probably should not hard-code 2 cores.
18001e7cb199 Uploaded greg parents: 4 diff changeset	59 gl <- vcfR2genlight(vcf, n.cores=2);
18001e7cb199 Uploaded greg parents: 4 diff changeset	60 genind <- new("genind", (as.matrix(gl)));
18001e7cb199 Uploaded greg parents: 4 diff changeset	61
0 725b160c91f0 Uploaded greg parents: diff changeset	62 # Add population information to the genind object.
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	63 poptab <- read.table(opt$input_pop_info, check.names=FALSE, header=T, na.strings=c("", "NA"));
3 1bc815d9c8c5 Uploaded greg parents: 2 diff changeset	64 genind@pop <- as.factor(poptab$region);
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	65
18001e7cb199 Uploaded greg parents: 4 diff changeset	66 # Convert genind object to a genclone object.
3 1bc815d9c8c5 Uploaded greg parents: 2 diff changeset	67 gclo <- as.genclone(genind);
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	68
18001e7cb199 Uploaded greg parents: 4 diff changeset	69 # Calculate the bitwise distance between individuals.
18001e7cb199 Uploaded greg parents: 4 diff changeset	70 xdis <- bitwise.dist(gclo);
0 725b160c91f0 Uploaded greg parents: diff changeset	71
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	72 # Multilocus genotypes (threshold of 1%).
18001e7cb199 Uploaded greg parents: 4 diff changeset	73 mlg.filter(gclo, distance=xdis) <- 0.01;
0 725b160c91f0 Uploaded greg parents: diff changeset	74 m <- mlg.table(gclo, background=TRUE, color=TRUE);
725b160c91f0 Uploaded greg parents: diff changeset	75
725b160c91f0 Uploaded greg parents: diff changeset	76 # Create table of MLGs.
725b160c91f0 Uploaded greg parents: diff changeset	77 id <- mlg.id(gclo);
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	78 dt <- data.table(id, keep.rownames=TRUE);
18001e7cb199 Uploaded greg parents: 4 diff changeset	79 setnames(dt, c("id"), c("user_specimen_id"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	80
18001e7cb199 Uploaded greg parents: 4 diff changeset	81 # Read user's Affymetrix 96 well plate csv file.
18001e7cb199 Uploaded greg parents: 4 diff changeset	82 pinfo <- read.csv(opt$input_affy_metadata, stringsAsFactors=FALSE);
18001e7cb199 Uploaded greg parents: 4 diff changeset	83 pinfo <- pinfo$user_specimen_id;
18001e7cb199 Uploaded greg parents: 4 diff changeset	84 pi <- data.table(pinfo);
18001e7cb199 Uploaded greg parents: 4 diff changeset	85 setnames(pi, c("pinfo"), c("user_specimen_id"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	86
18001e7cb199 Uploaded greg parents: 4 diff changeset	87 # Instantiate database connection.
18001e7cb199 Uploaded greg parents: 4 diff changeset	88 # The connection string has this format:
18001e7cb199 Uploaded greg parents: 4 diff changeset	89 # postgresql://user:password@host/dbname
18001e7cb199 Uploaded greg parents: 4 diff changeset	90 conn_string <- opt$database_connection_string;
18001e7cb199 Uploaded greg parents: 4 diff changeset	91 conn_items <- strsplit(conn_string, "://")[[1]];
18001e7cb199 Uploaded greg parents: 4 diff changeset	92 string_needed <- conn_items[1];
18001e7cb199 Uploaded greg parents: 4 diff changeset	93 items_needed <- strsplit(string_needed, "@")[[1]];
18001e7cb199 Uploaded greg parents: 4 diff changeset	94 user_pass_string <- items_needed[1];
18001e7cb199 Uploaded greg parents: 4 diff changeset	95 host_dbname_string <- items_needed[2];
18001e7cb199 Uploaded greg parents: 4 diff changeset	96 user_pass_items <- strsplit(user_pass_string, ":")[[1]];
18001e7cb199 Uploaded greg parents: 4 diff changeset	97 host_dbname_items <- strsplit(host_dbname_string, "/")[[1]];
18001e7cb199 Uploaded greg parents: 4 diff changeset	98 user <- user_pass_items[1];
18001e7cb199 Uploaded greg parents: 4 diff changeset	99 pass <- user_pass_items[2];
18001e7cb199 Uploaded greg parents: 4 diff changeset	100 host <- host_dbname_items[1];
18001e7cb199 Uploaded greg parents: 4 diff changeset	101 dbname <- host_dbname_items[2];
18001e7cb199 Uploaded greg parents: 4 diff changeset	102 # FIXME: is there a way to not hard-code the port?
18001e7cb199 Uploaded greg parents: 4 diff changeset	103 conn <- DBI::dbConnect(RPostgres::Postgres(), host=host, port='5432', dbname=dbname, user=user, password=pass);
18001e7cb199 Uploaded greg parents: 4 diff changeset	104
18001e7cb199 Uploaded greg parents: 4 diff changeset	105 # Import the sample table.
18001e7cb199 Uploaded greg parents: 4 diff changeset	106 sample_table <- tbl(conn, "sample");
18001e7cb199 Uploaded greg parents: 4 diff changeset	107
18001e7cb199 Uploaded greg parents: 4 diff changeset	108 # Select user_specimen_id and mlg columns.
18001e7cb199 Uploaded greg parents: 4 diff changeset	109 smlg <- sample_table %>% select(user_specimen_id, coral_mlg_clonal_id, symbio_mlg_clonal_id);
18001e7cb199 Uploaded greg parents: 4 diff changeset	110
18001e7cb199 Uploaded greg parents: 4 diff changeset	111 # Convert to dataframe.
18001e7cb199 Uploaded greg parents: 4 diff changeset	112 sm <- data.frame(smlg);
18001e7cb199 Uploaded greg parents: 4 diff changeset	113 sm[sm==""] <- NA;
18001e7cb199 Uploaded greg parents: 4 diff changeset	114
18001e7cb199 Uploaded greg parents: 4 diff changeset	115 # Convert missing data into data table.
18001e7cb199 Uploaded greg parents: 4 diff changeset	116 mi <-setDT(missing_gt_data_frame, keep.rownames=TRUE)[];
18001e7cb199 Uploaded greg parents: 4 diff changeset	117 # Change names to match db.
18001e7cb199 Uploaded greg parents: 4 diff changeset	118 setnames(mi, c("rn"), c("user_specimen_id"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	119 setnames(mi, c("myMiss"), c("percent_missing_data_coral"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	120 # Round missing data to two digits.
18001e7cb199 Uploaded greg parents: 4 diff changeset	121 mi$percent_missing <- round(mi$percent_missing, digits=2);
18001e7cb199 Uploaded greg parents: 4 diff changeset	122
18001e7cb199 Uploaded greg parents: 4 diff changeset	123 # Convert heterozygosity data into data table.
18001e7cb199 Uploaded greg parents: 4 diff changeset	124 ht <-setDT(ht, keep.rownames=TRUE)[];
18001e7cb199 Uploaded greg parents: 4 diff changeset	125 # Change names to match db.
18001e7cb199 Uploaded greg parents: 4 diff changeset	126 setnames(ht, c("rn"), c("user_specimen_id"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	127 setnames(ht, c("hets"), c("percent_mixed_coral"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	128 # Round missing data to two digits.
18001e7cb199 Uploaded greg parents: 4 diff changeset	129 ht$percent_mixed<-round(ht$percent_mixed, digits=2);
18001e7cb199 Uploaded greg parents: 4 diff changeset	130
18001e7cb199 Uploaded greg parents: 4 diff changeset	131 # Convert refA data into data.table.
18001e7cb199 Uploaded greg parents: 4 diff changeset	132 rA <-setDT(rA, keep.rownames=TRUE)[];
18001e7cb199 Uploaded greg parents: 4 diff changeset	133 # Change names to match db.
18001e7cb199 Uploaded greg parents: 4 diff changeset	134 setnames(rA, c("rn"), c("user_specimen_id"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	135 setnames(rA, c("refA"), c("percent_reference_coral"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	136 # round missing data to two digits.
18001e7cb199 Uploaded greg parents: 4 diff changeset	137 rA$percent_reference<-round(rA$percent_reference, digits=2);
18001e7cb199 Uploaded greg parents: 4 diff changeset	138
18001e7cb199 Uploaded greg parents: 4 diff changeset	139 # Convert altB data into data table.
18001e7cb199 Uploaded greg parents: 4 diff changeset	140 aB <-setDT(aB, keep.rownames=TRUE)[];
18001e7cb199 Uploaded greg parents: 4 diff changeset	141 # Change names to match db.
18001e7cb199 Uploaded greg parents: 4 diff changeset	142 setnames(aB, c("rn"), c("user_specimen_id"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	143 setnames(aB, c("altB"), c("percent_alternative_coral"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	144 # Round missing data to two digits.
18001e7cb199 Uploaded greg parents: 4 diff changeset	145 aB$percent_alternative<-round(aB$percent_alternative, digits=2);
18001e7cb199 Uploaded greg parents: 4 diff changeset	146
18001e7cb199 Uploaded greg parents: 4 diff changeset	147 #convert mlg id to data.table format
18001e7cb199 Uploaded greg parents: 4 diff changeset	148 dt <- data.table(id, keep.rownames=TRUE);
18001e7cb199 Uploaded greg parents: 4 diff changeset	149 # Change name to match db.
18001e7cb199 Uploaded greg parents: 4 diff changeset	150 setnames(dt, c("id"), c("user_specimen_id"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	151
18001e7cb199 Uploaded greg parents: 4 diff changeset	152 # Transform.
18001e7cb199 Uploaded greg parents: 4 diff changeset	153 df3 <- dt %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	154 group_by(row_number()) %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	155 dplyr::rename(group='row_number()') %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	156 unnest (user_specimen_id) %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	157 # Join with mlg table.
18001e7cb199 Uploaded greg parents: 4 diff changeset	158 left_join(sm %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	159 select("user_specimen_id","coral_mlg_clonal_id"), by='user_specimen_id');
18001e7cb199 Uploaded greg parents: 4 diff changeset	160
18001e7cb199 Uploaded greg parents: 4 diff changeset	161 # If found in database, group members on previous mlg id.
18001e7cb199 Uploaded greg parents: 4 diff changeset	162 uniques <- unique(df3[c("group", "coral_mlg_clonal_id")]);
18001e7cb199 Uploaded greg parents: 4 diff changeset	163 uniques <- uniques[!is.na(uniques$coral_mlg_clonal_id),];
18001e7cb199 Uploaded greg parents: 4 diff changeset	164 na.mlg <- which(is.na(df3$coral_mlg_clonal_id));
18001e7cb199 Uploaded greg parents: 4 diff changeset	165 na.group <- df3$group[na.mlg];
18001e7cb199 Uploaded greg parents: 4 diff changeset	166 df3$coral_mlg_clonal_id[na.mlg] <- uniques$coral_mlg_clonal_id[match(na.group, uniques$group)];
18001e7cb199 Uploaded greg parents: 4 diff changeset	167
18001e7cb199 Uploaded greg parents: 4 diff changeset	168 # Determine if the sample mlg matched previous genotyped sample.
18001e7cb199 Uploaded greg parents: 4 diff changeset	169 df4<- df3 %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	170 group_by(group) %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	171 mutate(DB_match = ifelse(is.na(coral_mlg_clonal_id),"no_match","match"));
18001e7cb199 Uploaded greg parents: 4 diff changeset	172
18001e7cb199 Uploaded greg parents: 4 diff changeset	173 # Create new mlg id for samples that did not match those in the database.
18001e7cb199 Uploaded greg parents: 4 diff changeset	174 none <- unique(df4[c("group", "coral_mlg_clonal_id")]);
18001e7cb199 Uploaded greg parents: 4 diff changeset	175 none <- none[is.na(none$coral_mlg_clonal_id),];
18001e7cb199 Uploaded greg parents: 4 diff changeset	176 na.mlg2 <- which(is.na(df4$coral_mlg_clonal_id));
18001e7cb199 Uploaded greg parents: 4 diff changeset	177 n.g <- df4$group[na.mlg2];
18001e7cb199 Uploaded greg parents: 4 diff changeset	178 ct <- length(unique(n.g));
18001e7cb199 Uploaded greg parents: 4 diff changeset	179
18001e7cb199 Uploaded greg parents: 4 diff changeset	180 # List of new group ids, the sequence starts at the number of
18001e7cb199 Uploaded greg parents: 4 diff changeset	181 # ids present in df4$coral_mlg_clonal_ids plus 1. Not sure if
18001e7cb199 Uploaded greg parents: 4 diff changeset	182 # the df4 file contains all ids. If it doesn't then look below
18001e7cb199 Uploaded greg parents: 4 diff changeset	183 # to change the seq() function.
18001e7cb199 Uploaded greg parents: 4 diff changeset	184 n.g_ids <- sprintf("HG%04d", seq((sum(!is.na(unique(df4["coral_mlg_clonal_id"]))) + 1), by=1, length=ct));
18001e7cb199 Uploaded greg parents: 4 diff changeset	185 # This is a key for pairing group with new ids.
18001e7cb199 Uploaded greg parents: 4 diff changeset	186 rat <- cbind(unique(n.g), n.g_ids);
18001e7cb199 Uploaded greg parents: 4 diff changeset	187 # this for loop assigns the new id iteratively for all that have NA.
18001e7cb199 Uploaded greg parents: 4 diff changeset	188 for (i in 1:length(na.mlg2)) {
18001e7cb199 Uploaded greg parents: 4 diff changeset	189 df4$coral_mlg_clonal_id[na.mlg2[i]] <- n.g_ids[match(df4$group[na.mlg2[i]], unique(n.g))];
18001e7cb199 Uploaded greg parents: 4 diff changeset	190 }
18001e7cb199 Uploaded greg parents: 4 diff changeset	191
18001e7cb199 Uploaded greg parents: 4 diff changeset	192 # Merge data frames for final table.
18001e7cb199 Uploaded greg parents: 4 diff changeset	193 report_user <- pi %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	194 # Join with the second file (only the first and third column).
18001e7cb199 Uploaded greg parents: 4 diff changeset	195 left_join(df4 %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	196 select("user_specimen_id","coral_mlg_clonal_id","DB_match"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	197 by='user_specimen_id') %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	198 # Join with the second file (only the first and third column).
18001e7cb199 Uploaded greg parents: 4 diff changeset	199 left_join(mi %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	200 select("user_specimen_id","percent_missing_coral"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	201 by='user_specimen_id') %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	202 # Join with the second file (only the first and third column).
18001e7cb199 Uploaded greg parents: 4 diff changeset	203 left_join(ht %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	204 select("user_specimen_id","percent_mixed_coral"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	205 by='user_specimen_id') %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	206 # Join with the second file (only the first and third column);
18001e7cb199 Uploaded greg parents: 4 diff changeset	207 left_join(rA %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	208 select("user_specimen_id","percent_reference_coral"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	209 by='user_specimen_id') %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	210 # Join with the second file (only the first and third column).
18001e7cb199 Uploaded greg parents: 4 diff changeset	211 left_join(aB %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	212 select("user_specimen_id","percent_alternative_coral"),
18001e7cb199 Uploaded greg parents: 4 diff changeset	213 by='user_specimen_id') %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	214 mutate(DB_match = ifelse(is.na(DB_match), "failed", DB_match))%>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	215 mutate(coral_mlg_clonal_id=ifelse(is.na(coral_mlg_clonal_id), "failed", coral_mlg_clonal_id))%>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	216 ungroup() %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	217 select(-group);
18001e7cb199 Uploaded greg parents: 4 diff changeset	218
18001e7cb199 Uploaded greg parents: 4 diff changeset	219 write.csv(report_user, file=paste(opt$output_stag_db_report), quote=FALSE);
0 725b160c91f0 Uploaded greg parents: diff changeset	220
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	221 # Rarifaction curve.
0 725b160c91f0 Uploaded greg parents: diff changeset	222 # Start PDF device driver.
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	223 dev.new(width=10, height=7);
a7cce4091e80 Uploaded greg parents: 3 diff changeset	224 file_path = get_file_path("geno_rarifaction_curve.pdf");
a7cce4091e80 Uploaded greg parents: 3 diff changeset	225 pdf(file=file_path, width=10, height=7);
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	226 rarecurve(m, ylab="Number of expected MLGs", sample=min(rowSums(m)), border=NA, fill=NA, font=2, cex=1, col="blue");
18001e7cb199 Uploaded greg parents: 4 diff changeset	227 dev.off();
18001e7cb199 Uploaded greg parents: 4 diff changeset	228
18001e7cb199 Uploaded greg parents: 4 diff changeset	229 # Genotype accumulation curve, sample is number of
18001e7cb199 Uploaded greg parents: 4 diff changeset	230 # loci randomly selected for to make the curve.
18001e7cb199 Uploaded greg parents: 4 diff changeset	231 dev.new(width=10, height=7);
18001e7cb199 Uploaded greg parents: 4 diff changeset	232 file_path = get_file_path("geno_accumulation_curve.pdf");
18001e7cb199 Uploaded greg parents: 4 diff changeset	233 pdf(file=file_path, width=10, height=7);
18001e7cb199 Uploaded greg parents: 4 diff changeset	234 genotype_curve(gind, sample=5, quiet=TRUE);
18001e7cb199 Uploaded greg parents: 4 diff changeset	235 dev.off();
0 725b160c91f0 Uploaded greg parents: diff changeset	236
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	237 # Create a phylogeny of samples based on distance matrices.
a7cce4091e80 Uploaded greg parents: 3 diff changeset	238 cols <- palette(brewer.pal(n=12, name='Set3'));
a7cce4091e80 Uploaded greg parents: 3 diff changeset	239 set.seed(999);
a7cce4091e80 Uploaded greg parents: 3 diff changeset	240 # Start PDF device driver.
a7cce4091e80 Uploaded greg parents: 3 diff changeset	241 dev.new(width=10, height=7);
a7cce4091e80 Uploaded greg parents: 3 diff changeset	242 file_path = get_file_path("nj_phylogeny.pdf");
a7cce4091e80 Uploaded greg parents: 3 diff changeset	243 pdf(file=file_path, width=10, height=7);
a7cce4091e80 Uploaded greg parents: 3 diff changeset	244 # Organize branches by clade.
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	245 tree <- gclo %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	246 aboot(dist=provesti.dist, sample=10, tree="nj", cutoff=50, quiet=TRUE) %>%
18001e7cb199 Uploaded greg parents: 4 diff changeset	247 ladderize();
4 a7cce4091e80 Uploaded greg parents: 3 diff changeset	248 plot.phylo(tree, tip.color=cols[obj2$pop],label.offset=0.0125, cex=0.7, font=2, lwd=4);
a7cce4091e80 Uploaded greg parents: 3 diff changeset	249 # Add a scale bar showing 5% difference..
a7cce4091e80 Uploaded greg parents: 3 diff changeset	250 add.scale.bar(length=0.05, cex=0.65);
a7cce4091e80 Uploaded greg parents: 3 diff changeset	251 nodelabels(tree$node.label, cex=.5, adj=c(1.5, -0.1), frame="n", font=3, xpd=TRUE);
7 18001e7cb199 Uploaded greg parents: 4 diff changeset	252 dev.off();
0 725b160c91f0 Uploaded greg parents: diff changeset	253

Mercurial > repos > greg > multilocus_genotype

annotate multilocus_genotype.R @ 7:18001e7cb199 draft