microSysMics issueshttps://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues2020-05-18T19:42:45Zhttps://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/31Boxplot abondance relative2020-05-18T19:42:45ZErwan DELAGEBoxplot abondance relativeIntégrer des boxplot d'abondance relative (TSS + log10) sur les TOP n taxons (en terme d'abondance médiane)
TOP n ou taxons dont l'abondance médiane est supérieure à un certain seuilIntégrer des boxplot d'abondance relative (TSS + log10) sur les TOP n taxons (en terme d'abondance médiane)
TOP n ou taxons dont l'abondance médiane est supérieure à un certain seuilhttps://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/38Heatmap tables d'abondance2021-01-19T11:04:37ZErwan DELAGEHeatmap tables d'abondanceDes heatmaps avec clustering et possibilité de trier par catégorie, à chaque rang taxo, seraient intéressantes.
Choix normalisation TSS, CLR, weighted CLR.Des heatmaps avec clustering et possibilité de trier par catégorie, à chaque rang taxo, seraient intéressantes.
Choix normalisation TSS, CLR, weighted CLR.https://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/37Nouvelles étapes à éventuellement considérer2021-01-06T15:12:43ZErwan DELAGENouvelles étapes à éventuellement considérerUtiliser les échantillons témoins pour traiter la contamination : Microdecon, DecontamR
Réduction du nombre d'ASV (meilleure estimation de l'alpha diversité): lulu, dbotu3Utiliser les échantillons témoins pour traiter la contamination : Microdecon, DecontamR
Réduction du nombre d'ASV (meilleure estimation de l'alpha diversité): lulu, dbotu3https://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/34Demultiplexing2020-06-11T08:33:39ZErwan DELAGEDemultiplexingLe pipeline fonctionne uniquement avec des séquences déjà démultiplexées. Les données du projet EcoVitiSol ne le sont pas (on a un fastq forward, un reverse, et un fichier de métadonnées avec les barcode).
Qiime2 propose, via cutadapt, u...Le pipeline fonctionne uniquement avec des séquences déjà démultiplexées. Les données du projet EcoVitiSol ne le sont pas (on a un fastq forward, un reverse, et un fichier de métadonnées avec les barcode).
Qiime2 propose, via cutadapt, un demultiplexing des séquences. Il faut pour cela importer les données en tant que données multiplexées (via le type EMPPairedEndSequences) par exemple. Le problème est double :
- les données peuvent visiblement être formatées de plusieurs façons différentes, et un pré-traitement sera de toute façon nécessaire.
- le contrôle qualité via multiqc exige d'avoir les fastq démultiplexés, et non pas sous la forme d'un artifact QZA
Pour le moment, on se contente avec EcoVitiSol de faire le demultiplexage hors du pipeline avec cutadapt
~~~
cutadapt --no-indels -g file:barcodes_forward.fasta -G file:barcodes_reverse.fasta -o ../fastq_demultiplexed/{name1}-{name2}_R1.fastq.gz -p ../fastq_demultiplexed/{name1}-{name2}_R2.fastq.gz GnS-EcoVitiSol-16S-B_S1_L001_R1_001.fastq.gz GnS-EcoVitiSol-16S-B_S1_L001_R2_001.fastq.gz
~~~https://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/33Paramètres de trim automatique avec Figaro2020-05-19T14:41:06ZErwan DELAGEParamètres de trim automatique avec FigaroPhilippe a trouvé cet outil : https://github.com/Zymo-Research/figaro#figaroPhilippe a trouvé cet outil : https://github.com/Zymo-Research/figaro#figarohttps://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/25Filtre sur table d'abondance2021-02-17T17:02:56ZErwan DELAGEFiltre sur table d'abondanceAjouter la possibilité de filtrer les échantillons/ASV après l'inférence de la table.Ajouter la possibilité de filtrer les échantillons/ASV après l'inférence de la table.https://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/22OSError: [Errno 7] Argument list too long2020-03-21T12:20:31ZErwan DELAGEOSError: [Errno 7] Argument list too longPour les tâches qui effectuent le merging des tables et des séquences (après deblur), si la liste des arguments est trop longue on tombe sur cette erreur. En lançant la commande en qlogin, le problème n'apparait pas.Pour les tâches qui effectuent le merging des tables et des séquences (après deblur), si la liste des arguments est trop longue on tombe sur cette erreur. En lançant la commande en qlogin, le problème n'apparait pas.https://univ-nantes.io/bird_pipeline_registry/microSysMics/-/issues/18Restructuration2020-03-21T12:20:01ZErwan DELAGERestructurationSuite à la réunion avec Eric, les points suivants ont été abordés pour une restructuration du pipeline :
* Gérer les conditionnelles avec des wildcards
* Déporter toutes les commandes d’export vers une rule dédiée
* Nommer les fichier...Suite à la réunion avec Eric, les points suivants ont été abordés pour une restructuration du pipeline :
* Gérer les conditionnelles avec des wildcards
* Déporter toutes les commandes d’export vers une rule dédiée
* Nommer les fichiers plutôt que d’utiliser l’index
* Utiliser un dictionnaire (unpack) pour les fonctions input/output
* Simplifier les input/output (pas de fonction)