Au cours de cette séance de TP nous allons chercher les mutations de-novo d'un enfant dont l'exome ainsi que celui de ses deux parents ont été séquencés par la technologie Illumina. Il vous faudra :
...
...
@@ -16,6 +16,43 @@ Certains outils ont besoin de place; le cas échéant, faites de la place, videz
Le TP peut être long pour les débutants: concentrez vous sur la production du fichier VCF final, et cherchez à répondre aux questions de détails plus tard.
## workflow

## Petit rappel sur la structure d'un Makefile
> Les Makefiles sont des fichiers, généralement appelés **Makefile**, utilisés par le programme make pour exécuter un ensemble d'actions
Un Makefile est un fichier constitué de plusieurs règles de la forme :
Lorsque l'ensemble des dépendances est analysé et si la cible ne correspond pas à un fichier existant ou si un fichier dépendance est plus récent que la régle, les différentes commandes sont exécutées.
A priori tous les outils ont été installés. Pas besoin d'installer samtools, bwa etc... comme décrit ci-dessous. En revanche vous devez indiquer au `bash` où se trouvent les outils en faisant:
...
...
@@ -468,8 +523,11 @@ Pour l'instant les reads ne sont pas triés sur la position génomique (chrom/st
Usage: samtools sort [options...] [in.bam]
Options:
-l INT Set compression level, from 0 (uncompressed) to 9 (best)
-u Output uncompressed data (equivalent to -l 0)
-m INT Set maximum memory per thread; suffix K/M/G recognized [768M]
-n Sort by read name
-M Use minimiser for clustering unaligned/unplaced reads
-K INT Kmer size to use for minimiser [20]
-n Sort by read name (not compatible with samtools index command)
-t TAG Sort by value of TAG. Uses position as secondary index (or read name if -n is set)
-o FILE Write final output to FILE rather than standard output
-T PREFIX Write temporary files to PREFIX.nnnn.bam
...
...
@@ -488,6 +546,7 @@ Options:
Number of additional threads to use [0]
--verbosity INT
Set level of verbosity
```
...
...
@@ -670,21 +729,23 @@ et créez le fichier **father.bam**
Le calling des mutation se fait à l'aide de
* `samtools mpileup` qui va générer les bases trouvées à toutes les positions pour les 3 bams. Cet outil génére un fichier binaire de variants (BCF).
* `bcftools mpileup` qui va générer les bases trouvées à toutes les positions pour les 3 bams. Cet outil génére un fichier binaire de variants (BCF).
* `bcftools view` va transformer le **BCF** (binaire) en format *VCF* (*Variant Call Format*).