Notebook issueshttps://univ-nantes.io/E15G239M/notebook/-/issues2020-04-14T09:03:40Zhttps://univ-nantes.io/E15G239M/notebook/-/issues/1Commentaires 12020-04-14T09:03:40ZPierre LINDENBAUMCommentaires 1https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_wf.nf#L26
c'est quoi cette ligne ? elle sert à quoi ?
https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f12...https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_wf.nf#L26
c'est quoi cette ligne ? elle sert à quoi ?
https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_wf.nf#L29
je prefererais que ça soit un argument de ton script R.
https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_analyses.R#L16
c'est quoi ALT1 vs ALT2. Pour les dialleliques ? comment utiliser cette information ? comment feras tu pour les multialleliques > 2?
Pour ce problème (connu) des multialleliques, tu peux considerer que dès qu'un allele n'est pas REF, il s'agit du même allele rare ou bien tu peux ajouter une normalisation `bcftools norm` pour convertir les multialleliques en dialleliques (les deux solutions sont problèmatiques)
https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_analyses.R#L7
C'est un bon commencement pour lire les VCFs mais rapidement vas re-inventer un parser de VCF, il faut vraiment que tu utises une API existante pour lire le VCF. Je ne connais pas celles en R.
Globalement tu as la bonne idée pour scanner le vcf (scanner les genotypes, compter les genotypes qui portent l'allele rare).
https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_analyses.R#L26
commentaires en anglais STP. si le script est publié ça t'évitera dès maintenant à tout reprendre tes scripts...
https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_analyses.R#L39
par exemple là ton script ne marcherait pas si il y avait un genotype `10/11`
https://gitlab.univ-nantes.fr/E15G239M/notebook/-/blob/6016b6a1f208ce092f1203e0a3d76536ff9dffed/2020/test_analyses.R#L43
même idée ici si le génotype est `2/3`Jolann POMMELLECJolann POMMELLEC