elsherbini · October 12, 2017 16:02
diff --git a/README.md b/README.md
diff --git a/config.yaml b/config.yaml
 cutadapt_params:
  quality_cutoff: 10
  quality_base: 64 # Illumina 1.5
  overlap: 3 #

diff --git a/Snakefile b/Snakefile
 STRAINS = glob_wildcards("input/{strain1}/{strain2}.raw_reads.f.fq").strain1

 configfile: 'config.yaml'
 print(config)
 rule all:
    input:
        expand("tmp/{strain}/{strain}.trim_adapter.{direction}.fq", strain=STRAINS, direction=['f', 'r'])

 rule remove_suffix:
    input:
        fastq = "input/{strain}/{strain}.raw_reads.{direction}.fq"
    output:
        fastq = "tmp/{strain}/{strain}.remove_suffix.{direction}.fq"
    shell:
        "sed -e '0~4N;s/;[0-9]$//g' {input.fastq} > {output.fastq}"

 rule cutadapt:
    input:
        f = "tmp/{strain}/{strain}.remove_suffix.f.fq",
        r = "tmp/{strain}/{strain}.remove_suffix.r.fq"
    output:
        f = "tmp/{strain}/{strain}.trim_adapter.f.fq",
        r = "tmp/{strain}/{strain}.trim_adapter.r.fq",
        f_removed = "tmp/{strain}/{strain}.trim_adapter.f.discard.fq",
        r_removed = "tmp/{strain}/{strain}.trim_adapter.r.discard.fq",
        log = "tmp/{strain}/{strain}.trim_adapter.log.txt"
    params:
        overlap = config["cutadapt_params"]["overlap"],
        quality_base = config["cutadapt_params"]["quality_base"],
        quality_cutoff = config["cutadapt_params"]["quality_cutoff"]
    shell:
        """
        cutadapt -a CTGTCTCTTATACACATCTXXXXXX -a CAAGCAGAAGACGGCATACXXXXXX \\
        --pair-filter=both \\
        --info-file {output.log} \\
        --untrimmed-output {output.f} \\
        --untrimmed-paired-output {output.r} \\
        --overlap={params.overlap} \\
        --quality-base={params.quality_base} \\
        --quality-cutoff={params.quality_cutoff} \\
        -o {output.f_removed} \\
        -p {output.r_removed} \\
        {input.f} {input.r}
        """
	cutadapt_params:
	quality_cutoff: 10
	quality_base: 64 # Illumina 1.5
	overlap: 3 #
	STRAINS = glob_wildcards("input/{strain1}/{strain2}.raw_reads.f.fq").strain1

	configfile: 'config.yaml'
	print(config)
	rule all:
	input:
	expand("tmp/{strain}/{strain}.trim_adapter.{direction}.fq", strain=STRAINS, direction=['f', 'r'])

	rule remove_suffix:
	input:
	fastq = "input/{strain}/{strain}.raw_reads.{direction}.fq"
	output:
	fastq = "tmp/{strain}/{strain}.remove_suffix.{direction}.fq"
	shell:
	"sed -e '0~4N;s/;[0-9]$//g' {input.fastq} > {output.fastq}"

	rule cutadapt:
	input:
	f = "tmp/{strain}/{strain}.remove_suffix.f.fq",
	r = "tmp/{strain}/{strain}.remove_suffix.r.fq"
	output:
	f = "tmp/{strain}/{strain}.trim_adapter.f.fq",
	r = "tmp/{strain}/{strain}.trim_adapter.r.fq",
	f_removed = "tmp/{strain}/{strain}.trim_adapter.f.discard.fq",
	r_removed = "tmp/{strain}/{strain}.trim_adapter.r.discard.fq",
	log = "tmp/{strain}/{strain}.trim_adapter.log.txt"
	params:
	overlap = config["cutadapt_params"]["overlap"],
	quality_base = config["cutadapt_params"]["quality_base"],
	quality_cutoff = config["cutadapt_params"]["quality_cutoff"]
	shell:
	"""
	cutadapt -a CTGTCTCTTATACACATCTXXXXXX -a CAAGCAGAAGACGGCATACXXXXXX \\
	--pair-filter=both \\
	--info-file {output.log} \\
	--untrimmed-output {output.f} \\
	--untrimmed-paired-output {output.r} \\
	--overlap={params.overlap} \\
	--quality-base={params.quality_base} \\
	--quality-cutoff={params.quality_cutoff} \\
	-o {output.f_removed} \\
	-p {output.r_removed} \\
	{input.f} {input.r}
	"""