-
Notifications
You must be signed in to change notification settings - Fork 6
New issue
Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? # to your account
first version of nf pipeline #33
Conversation
nextflow/modules/CONVERT/convert.nf
Outdated
|
||
output: | ||
tuple val(meta), path(vcf1), path(vcf2) | ||
//tuple val(meta), path(vcf1), path(vcf2) |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
cleaning up comment lines?
sampleId="!{meta.data1Id}" | ||
if [[ "!{files[1]}" == *".gz" ]] | ||
then | ||
cp "!{files[1]}" "!{vcf2}" |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
hoe werkt dit precies, want vcf1 en vcf2 zijn volgens convert.nf vcf1="${meta.data1Id}.converted.vcf.gz"
en vcf2="${meta.data2Id}.converted.vcf.gz"
files[1] wordt gekopieerd of indien het nog geen .gz file is, word ie ge-bgzipped.
Helemaal onderin het script schrijf je je output weg naar ${sampleId}.converted.vcf
, die je daarna ook bgzipped.
Dus eerst kopieer/bgzip je de file om um daarna te laten overschrijven door het array-as-vcf
script?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Ja dit stukje verdient niet de schoonheidprijs, en ik moet hier nog een betere oplossing voor vinden, maar dat is nog niet gelukt zonder hele pipeline te moeten verbouwen. Maar het probleem wat ik hier tegenaanloop is dat er 2 inputfiles in dit script gaan, waarbij je met 1 maar wat mee doet. alleen de openarray file. Met de vcf gebeurd niks. Alleen weet ik niet of file 1 een vcf is of file 2. Maar ik mag niet niks doen met file 2 de vcf, vandaar dat ik die kopieer. Anders stuitert nf. En ik moet ook checken of het wel een .vcf of .vcf.gz is, anders wordt de file als .gz weggeschreven zonder dat die ingepakt is. Dan krijg je verderop weer problemen dat het een niet ingepakt file is met een .gz extentie. Het werk voor nu, maar het moet nog een keer anders denk ik.
nextflow/nextflow.config
Outdated
reference.b37 = "/apps/data/1000G/phase1/human_g1k_v37_phiX.fasta" | ||
reference.b38 = "/apps/data/GRC/GRCh38/GRCh38_full_analysis_set_plus_decoy_hla.fa" | ||
intermediateDir = "$launchDir/results" | ||
TmpDir = "$launchDir/tmp" |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ik zou een kleine letter als eerste character doen van een variabele
|
||
# run concordancecheck | ||
java -XX:ParallelGCThreads="!{task.cpus}" \ | ||
-Djava.io.tmpdir="!{params.TmpDir}" \ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
moet je deze ook even als tmpDir schrijven
cp "!{files[1]}" "!{vcf2}" | ||
fi | ||
|
||
java -Djava.io.tmpdir="!{params.TmpDir}" \ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
en hier en op regel 28 van deze file
No description provided.