diff optimizer_command @ 3:221db2eb3c8e draft default tip

Uploaded
author elixir-it
date Wed, 22 Jul 2020 19:23:14 +0000
parents 6e4eb4856874
children
line wrap: on
line diff
--- a/optimizer_command	Wed Jul 22 19:20:30 2020 +0000
+++ /dev/null	Thu Jan 01 00:00:00 1970 +0000
@@ -1,64 +0,0 @@
-Il comando per lanciarlo è qualcosa di questo tipo:
-
-perl optimizer.pl -leQTL qfile -similarD sfile -disease dilated_ -lgenes
-DCM_genes -fileR ALL_DCM_Final.vcf.annovar_ANNOT_B.hg19_multianno.vcf
--fileC test_unaffected.vcf -ofile test_RES_2
-
-I parametri, sono molto simili al precedente, anche se alcuni sono
-leggermente diversi. Infatti questo prende 2 file di input e fa un
-output solo.
-
-Questa è la lista dei parametri
-
-%arguments=
-(
-"fileR"=>"",                          #file: vcf file of affected
-individuals
-"fileC"=>"",                          #file: vcf file of unaffected
-individuals
-"ofile"=>"",                          #name: name of the output files
-"disease_clinvar"=>[4,6],    #numeric mandadory, range,
-"score_AF"=>[2,4],              #numeric mandatory, range
-"score_functional"=>[4,6],  #numeric mandatory, range
-"score_NS"=>[2,4],             #numeric mandatory, range
-"score_nIND"=>[2,4],          #numeric mandatory, range
-"scoreeQTL"=>[2,4],           #numeric mandatory, range
-"scoreG"=>[3,5],                 #numeric  mandatory, range
-"disease"=>"",                    #name   optional
-"similarD"=>"",                   #file optional
-"lgenes"=>"",                     #file optional
-"leQTL"=>"qfile",               #file   mandatory, but default value
-"keywords"=>"kfile",         #file   mandatory, but default value
-"effects"=>"efile",             #file   mandatory, but default value
-"AF"=>0.0001                    #numeric, mandatory, but default value
-);
-
-L'altra differenza fondamentale è che ora i parametri numerici devono
-avere un range. Ad esempio -param 4:6 indica che il parametro assumerà i
-valori 4,5,6. Se questo modo di codificare i parametri è scomodo,
-possiamo trovare un altro tipo di codifica.
-
-Infine lo script lancia altri 2 script, uno è il precedente che ti ho
-già passato "score_complete_alt.pl" e l'altro è uno script in R che si
-chiama "wilcox.R".  Gli script vengono chiamati con i percorsi assoluti,
-quindi la cosa più semplice sarebbe averne una copia nella cartella da
-cui viene eseguito lo script principale, o in alternativa  fare una
-copia di tutti 3 gli script nella cartella in cui stanno i dati e poi
-eseguirli da lì
-
-Trovi il tutto  a questo link: http://159.149.160.53/coso/optimizer/ I
-due vcf sono i due input (vedi sopra). test_RES_2 è un esempio di
-output. é sempre tabulare.
-
-#gen 2020
-Nuova versione
-1 incorpora punteggi e annotazioni aggiuntive
-2 usa gli algoritmi genetici per trovare i pesi ottimali
-3 il criterio di ottimalità è pesato "meglio" su p-value, numero totale di positivi e numero totale di presunti falsi positivi
-comando:
-perl optimizer_genetic.pl -fileR remapped_Sorrentino_DEV.vcf.hg38_multianno.vcf -fileC remapped_TSI_DEV.vcf.hg38_multianno.vcf -ofile TEST1 -keywords kfile  -effects efile  -AF 0.0001  -lgenes DCM_genes -leQTL qfile  -similarD sfile -disease _cardiomyopathy_#_dilated#_hypertrophic -nind 4 -AD T -XL F -score_AF 1:10 -score_functional 1:10 -score_NS 1:10 -score_nIND 1:10 -scoreeQTL 1:10 -scoreG 1:10 -scoreT 1:10 -scoreM 1:10 -scoreR 1:10 -scoreSP 1:10 -scoreGW 1:10
-
-i nuovi file di riferimento sono nella cartella.
-viene chiamanto lo script GENEO_VINYL.R
-per default, e per ora non deve essere un parametro configurabile
-gli algoritmi genetici fanno 100 generazioni di 100 individui.