Mercurial > repos > elixir-it > vinyl_optimizer
diff optimizer_command @ 3:221db2eb3c8e draft default tip
Uploaded
| author | elixir-it |
|---|---|
| date | Wed, 22 Jul 2020 19:23:14 +0000 |
| parents | 6e4eb4856874 |
| children |
line wrap: on
line diff
--- a/optimizer_command Wed Jul 22 19:20:30 2020 +0000 +++ /dev/null Thu Jan 01 00:00:00 1970 +0000 @@ -1,64 +0,0 @@ -Il comando per lanciarlo è qualcosa di questo tipo: - -perl optimizer.pl -leQTL qfile -similarD sfile -disease dilated_ -lgenes -DCM_genes -fileR ALL_DCM_Final.vcf.annovar_ANNOT_B.hg19_multianno.vcf --fileC test_unaffected.vcf -ofile test_RES_2 - -I parametri, sono molto simili al precedente, anche se alcuni sono -leggermente diversi. Infatti questo prende 2 file di input e fa un -output solo. - -Questa è la lista dei parametri - -%arguments= -( -"fileR"=>"", #file: vcf file of affected -individuals -"fileC"=>"", #file: vcf file of unaffected -individuals -"ofile"=>"", #name: name of the output files -"disease_clinvar"=>[4,6], #numeric mandadory, range, -"score_AF"=>[2,4], #numeric mandatory, range -"score_functional"=>[4,6], #numeric mandatory, range -"score_NS"=>[2,4], #numeric mandatory, range -"score_nIND"=>[2,4], #numeric mandatory, range -"scoreeQTL"=>[2,4], #numeric mandatory, range -"scoreG"=>[3,5], #numeric mandatory, range -"disease"=>"", #name optional -"similarD"=>"", #file optional -"lgenes"=>"", #file optional -"leQTL"=>"qfile", #file mandatory, but default value -"keywords"=>"kfile", #file mandatory, but default value -"effects"=>"efile", #file mandatory, but default value -"AF"=>0.0001 #numeric, mandatory, but default value -); - -L'altra differenza fondamentale è che ora i parametri numerici devono -avere un range. Ad esempio -param 4:6 indica che il parametro assumerà i -valori 4,5,6. Se questo modo di codificare i parametri è scomodo, -possiamo trovare un altro tipo di codifica. - -Infine lo script lancia altri 2 script, uno è il precedente che ti ho -già passato "score_complete_alt.pl" e l'altro è uno script in R che si -chiama "wilcox.R". Gli script vengono chiamati con i percorsi assoluti, -quindi la cosa più semplice sarebbe averne una copia nella cartella da -cui viene eseguito lo script principale, o in alternativa fare una -copia di tutti 3 gli script nella cartella in cui stanno i dati e poi -eseguirli da lì - -Trovi il tutto a questo link: http://159.149.160.53/coso/optimizer/ I -due vcf sono i due input (vedi sopra). test_RES_2 è un esempio di -output. é sempre tabulare. - -#gen 2020 -Nuova versione -1 incorpora punteggi e annotazioni aggiuntive -2 usa gli algoritmi genetici per trovare i pesi ottimali -3 il criterio di ottimalità è pesato "meglio" su p-value, numero totale di positivi e numero totale di presunti falsi positivi -comando: -perl optimizer_genetic.pl -fileR remapped_Sorrentino_DEV.vcf.hg38_multianno.vcf -fileC remapped_TSI_DEV.vcf.hg38_multianno.vcf -ofile TEST1 -keywords kfile -effects efile -AF 0.0001 -lgenes DCM_genes -leQTL qfile -similarD sfile -disease _cardiomyopathy_#_dilated#_hypertrophic -nind 4 -AD T -XL F -score_AF 1:10 -score_functional 1:10 -score_NS 1:10 -score_nIND 1:10 -scoreeQTL 1:10 -scoreG 1:10 -scoreT 1:10 -scoreM 1:10 -scoreR 1:10 -scoreSP 1:10 -scoreGW 1:10 - -i nuovi file di riferimento sono nella cartella. -viene chiamanto lo script GENEO_VINYL.R -per default, e per ora non deve essere un parametro configurabile -gli algoritmi genetici fanno 100 generazioni di 100 individui.
