Commit 04a0bcbc authored by Pierre LINDENBAUM's avatar Pierre LINDENBAUM
Browse files
parents 1130103c dac7613c
......@@ -6,7 +6,7 @@ Certaines étapes seront effectuées plusieurs fois (père, mère, enfant) je vo
Certains outils ont besoin de place; le cas échéant, faites de la place, videz vos répertoires temporaires.
La version de l'outil samtools actuellement installée à la fac est une vieille version (1.2). Elle est suffisante pour ce TP mais les commandes avec la nouvelles version de samtools sera légerement différent.
La version de l'outil samtools actuellement installée à la fac est une vieille version (1.2). Elle est suffisante pour ce TP mais les commandes avec la nouvelle version de samtools seront légerement différentes.
## Recupération des données FASTQ
......@@ -18,7 +18,7 @@ Téléchargez et extrayez le fichier zip avec
unzip DATA.zip
```
Ne **JAMAIS** dezipper les fichiers .fq.gz ( dans le futur, pour acceder au contenu de ces fichiers utilisez ` gunzip -c `, ou bien de nombreux outils NGS savent lire le format *gzip*).
Ne **JAMAIS** dezipper les fichiers .fq.gz (dans le futur, pour acceder au contenu de ces fichiers utilisez ` gunzip -c `, ou bien de nombreux outils NGS savent lire le format *gzip*).
Dans le repertoire *DATA* se trouvent les fichiers FASTQ contenant les short-reads pour father/mother/child.
......@@ -84,7 +84,7 @@ $ gunzip -c DATA/child.R1.fq.gz | paste - - - - | cut -f 4 | grep -o . | sort |
Pour aller vite, nous nous contenterons des chromosomes 22 et et de l'ADN mitochondrial humains.
* Si votre nom de famille commence avant la lettre 'L': Telechargez les séquences fa.gz **chr22** et **chrM** de la version **hg38/GRCh38** du genome humain .
* Si votre nom de famille commence avant la lettre 'L': Telechargez les séquences fa.gz **chr22** et **chrM** de la version **hg38/GRCh38** du genome humain.
```
$ wget -O chr22.fa.gz "http://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/chr22.fa.gz"
......@@ -92,7 +92,7 @@ $ wget -O chrM.fa.gz "http://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes
```
* Pour les autres, telechargze les séquences fa.gz **chr22** et **chrM** de la version **hg19/GRCh37** du genome humain.
* Pour les autres, telechargez les séquences fa.gz **chr22** et **chrM** de la version **hg19/GRCh37** du genome humain.
```
$ wget -O chr22.fa.gz "http://hgdownload.cse.ucsc.edu/goldenPath/hg19/chromosomes/chr22.fa.gz"
......@@ -135,7 +135,7 @@ $ cat chr22.fa chrM.fa > ref.fa
## TP septembre 2018
A priori tous les outils ont-été installés. Pas besoin d'installer samtools, bwa etc... comme décrit ci-dessous. En revanche vous devez indiquer au `bash` où se trouvent les outils en faisant:
A priori tous les outils ont été installés. Pas besoin d'installer samtools, bwa etc... comme décrit ci-dessous. En revanche vous devez indiquer au `bash` où se trouvent les outils en faisant:
```
export PATH="/usr/local/opt/sam_vcf_htslib/bin:${PATH}"
......@@ -348,7 +348,7 @@ grep -v '^@' child_unsorted.sam | head -n 1 | tr "\t" "\n" | cat -n
## Conversion de SAM en BAM
pour permettre aux algorithmes d'aller plus vite, nous utilisons samtools pour convertir le fichier en format texte/SAM `child.sam` en format binaire/BAM `child_unsorted.bam`
pour permettre aux algorithmes d'aller plus vite, nous utilisons samtools pour convertir le fichier en format texte/SAM `child_unsorted.sam` en format binaire/BAM `child_unsorted.bam`
### Synopsis:
......@@ -578,7 +578,7 @@ $ samtools mpileup -g --output-tags DP --fasta-ref ref.fa --output mutations.bcf
puis:
```
$ bcftools call --multiallelic-caller --variants-only --output-type z -o result.vcf.gz --format-fields GQ,GP input.bcf
$ bcftools call --multiallelic-caller --variants-only --output-type z -o result.vcf.gz --format-fields GQ,GP mutations.bcf
```
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment