Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

first version of nf pipeline #33

Merged
merged 8 commits into from
Mar 27, 2024
Merged

Conversation

Gerbenvandervries
Copy link
Member

No description provided.


output:
tuple val(meta), path(vcf1), path(vcf2)
//tuple val(meta), path(vcf1), path(vcf2)
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

cleaning up comment lines?

sampleId="!{meta.data1Id}"
if [[ "!{files[1]}" == *".gz" ]]
then
cp "!{files[1]}" "!{vcf2}"
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

hoe werkt dit precies, want vcf1 en vcf2 zijn volgens convert.nf vcf1="${meta.data1Id}.converted.vcf.gz" en vcf2="${meta.data2Id}.converted.vcf.gz"
files[1] wordt gekopieerd of indien het nog geen .gz file is, word ie ge-bgzipped.
Helemaal onderin het script schrijf je je output weg naar ${sampleId}.converted.vcf, die je daarna ook bgzipped.
Dus eerst kopieer/bgzip je de file om um daarna te laten overschrijven door het array-as-vcf script?

Copy link
Member Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ja dit stukje verdient niet de schoonheidprijs, en ik moet hier nog een betere oplossing voor vinden, maar dat is nog niet gelukt zonder hele pipeline te moeten verbouwen. Maar het probleem wat ik hier tegenaanloop is dat er 2 inputfiles in dit script gaan, waarbij je met 1 maar wat mee doet. alleen de openarray file. Met de vcf gebeurd niks. Alleen weet ik niet of file 1 een vcf is of file 2. Maar ik mag niet niks doen met file 2 de vcf, vandaar dat ik die kopieer. Anders stuitert nf. En ik moet ook checken of het wel een .vcf of .vcf.gz is, anders wordt de file als .gz weggeschreven zonder dat die ingepakt is. Dan krijg je verderop weer problemen dat het een niet ingepakt file is met een .gz extentie. Het werk voor nu, maar het moet nog een keer anders denk ik.

reference.b37 = "/apps/data/1000G/phase1/human_g1k_v37_phiX.fasta"
reference.b38 = "/apps/data/GRC/GRCh38/GRCh38_full_analysis_set_plus_decoy_hla.fa"
intermediateDir = "$launchDir/results"
TmpDir = "$launchDir/tmp"
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ik zou een kleine letter als eerste character doen van een variabele


# run concordancecheck
java -XX:ParallelGCThreads="!{task.cpus}" \
-Djava.io.tmpdir="!{params.TmpDir}" \
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

moet je deze ook even als tmpDir schrijven

cp "!{files[1]}" "!{vcf2}"
fi

java -Djava.io.tmpdir="!{params.TmpDir}" \
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

en hier en op regel 28 van deze file

@RoanKanninga RoanKanninga merged commit 89af5d3 into molgenis:master Mar 27, 2024
1 check passed
# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants