1 Set Up

Here are all the packages you will need for this code

BiocManager::install("DESeq2")

library(knitr)
library(tidyverse)
library(kableExtra)
library(DESeq2)
library(pheatmap)
library(RColorBrewer)
library(data.table)
library(DT)
library(Biostrings)
knitr::opts_chunk$set(
  echo = TRUE,         # Display code chunks
  eval = FALSE,        # Evaluate code chunks
  warning = FALSE,     # Hide warnings
  message = FALSE,     # Hide messages
  fig.width = 6,       # Set plot width in inches
  fig.height = 4,      # Set plot height in inches
  fig.align = "center" # Align plots to the center
)

2 Alignment using Kallisto

2.1 Getting sequences

File Location https://gannet.fish.washington.edu/seashell/bu-github/nb-2023/Cgigas/data/nopp/

This chunk uses wget to download files from the file location that matches a given pattern. In this instance, ’*001.fastq.gz’ dictates the file type and the last part of the file name.

cd ../data 
wget --recursive --no-parent --no-directories \
--accept '*001.fastq.gz' \
https://gannet.fish.washington.edu/seashell/bu-github/nb-2023/Cgigas/data/nopp/

2.2 Obtain the reference

We need to get a reference to which we can compare our sequence data

cd ../data
curl -O https://gannet.fish.washington.edu/seashell/bu-github/nb-2023/Cgigas/data/rna.fna

2.3 Index Reference

This code is indexing the file rna.fna while also renaming it as cgigas_roslin_rna.index

/home/shared/kallisto/kallisto \
index -i \
../data/cgigas_roslin_rna.index \
../data/rna.fna

2.4 Align reads

This code alligns the sequences

mkdir ../output/kallisto_01
find ../data/*_L001_R1_001.fastq.gz \
| xargs basename -s _L001_R1_001.fastq.gz | xargs -I{} /home/shared/kallisto/kallisto \
quant -i ../data/cgigas_roslin_rna.index \
-o ../output/kallisto_01/{} \
-t 40 \
--single -l 100 -s 10 ../data/{}_L001_R1_001.fastq.gz

This command runs the abundance_estimates_to_matrix.pl script from the Trinity RNA-seq assembly software package to create a gene expression matrix from kallisto output files.

perl /home/shared/trinityrnaseq-v2.12.0/util/abundance_estimates_to_matrix.pl \
--est_method kallisto \
    --gene_trans_map none \
    --out_prefix ../output/kallisto_01 \
    --name_sample_by_basedir \
    ../output/kallisto_01/D54_S145/abundance.tsv \
    ../output/kallisto_01/D56_S136/abundance.tsv \
    ../output/kallisto_01/D58_S144/abundance.tsv \
    ../output/kallisto_01/M45_S140/abundance.tsv \
    ../output/kallisto_01/M48_S137/abundance.tsv \
    ../output/kallisto_01/M89_S138/abundance.tsv \
    ../output/kallisto_01/D55_S146/abundance.tsv \
    ../output/kallisto_01/D57_S143/abundance.tsv \
    ../output/kallisto_01/D59_S142/abundance.tsv \
    ../output/kallisto_01/M46_S141/abundance.tsv \
    ../output/kallisto_01/M49_S139/abundance.tsv \
    ../output/kallisto_01/M90_S147/abundance.tsv \
    ../output/kallisto_01/N48_S194/abundance.tsv \
    ../output/kallisto_01/N50_S187/abundance.tsv \
    ../output/kallisto_01/N52_S184/abundance.tsv \
    ../output/kallisto_01/N54_S193/abundance.tsv \
    ../output/kallisto_01/N56_S192/abundance.tsv \
    ../output/kallisto_01/N58_S195/abundance.tsv \
    ../output/kallisto_01/N49_S185/abundance.tsv \
    ../output/kallisto_01/N51_S186/abundance.tsv \
    ../output/kallisto_01/N53_S188/abundance.tsv \
    ../output/kallisto_01/N55_S190/abundance.tsv \
    ../output/kallisto_01/N57_S191/abundance.tsv \
    ../output/kallisto_01/N59_S189/abundance.tsv

2.4.1 Read in Count matrix

Reads in a count matrix of isoform counts generated by Kallisto, with row names set to the gene/transcript IDs and the first column removed.

countmatrix <- read.delim("../output/kallisto_01.isoform.counts.matrix", header = TRUE, sep = '\t')
rownames(countmatrix) <- countmatrix$X
countmatrix <- countmatrix[,-1]
head(countmatrix)

##                   D54_S145 D56_S136 D58_S144 M45_S140    M48_S137   M89_S138
## XR_002198472.2 0.00000e+00   0.0000  0.00000   0.0000 0.00000e+00 0.00000000
## XM_011439767.3 3.17402e-08   0.0000  0.00000   0.0000 0.00000e+00 0.00000000
## XR_004595876.1 3.33657e+00   0.0000  6.54202   0.0000 0.00000e+00 0.00000000
## XM_011432597.3 0.00000e+00   0.0000  0.00000   0.0000 0.00000e+00 0.00000000
## XM_034467064.1 0.00000e+00   0.0000  0.00000   0.0000 0.00000e+00 0.00000000
## XM_034443175.1 2.59759e+01  33.2338 10.25260  52.7153 5.23614e-06 0.00825646
##                D55_S146 D57_S143 D59_S142  M46_S141 M49_S139 M90_S147 N48_S194
## XR_002198472.2        0   0.0000        0 0.0000000        0   0.0000        0
## XM_011439767.3        0   0.0000        0 0.4783700        0   0.0000        0
## XR_004595876.1        0   0.0000        0 0.0000000        0   0.0000        0
## XM_011432597.3        0   0.0000        0 0.0000000        0   0.0000        0
## XM_034467064.1        0   0.0000        1 0.0000000        0   0.0000        0
## XM_034443175.1        0  27.4283        0 0.0335607        0  31.4732        0
##                N50_S187 N52_S184 N54_S193 N56_S192 N58_S195 N49_S185 N51_S186
## XR_002198472.2        0   0.0000        0        0        0        0        0
## XM_011439767.3        0   0.0000        0        0        0        0        0
## XR_004595876.1        0   0.0000        0        0        0        0        0
## XM_011432597.3        0   0.0000        0        0        0        0        0
## XM_034467064.1        0   0.0000        0        0        0        0        0
## XM_034443175.1        0  29.6025        0        0        0        0        0
##                N53_S188 N55_S190    N57_S191 N59_S189
## XR_002198472.2    0.000  0.00000 0.00000e+00        0
## XM_011439767.3    0.000  0.00000 0.00000e+00        0
## XR_004595876.1   18.345  0.00000 0.00000e+00        0
## XM_011432597.3    0.000  0.00000 0.00000e+00        0
## XM_034467064.1    0.000  0.00000 0.00000e+00        0
## XM_034443175.1    0.000  9.87152 8.47129e-06        0

2.4.2 Round integers to whole numbers

Rounds the counts to whole numbers for further analysis

countmatrix <- round(countmatrix, 0)
str(countmatrix)

## 'data.frame':    73307 obs. of  24 variables:
##  $ D54_S145: num  0 0 3 0 0 26 0 0 15 15 ...
##  $ D56_S136: num  0 0 0 0 0 33 0 0 12 16 ...
##  $ D58_S144: num  0 0 7 0 0 10 0 0 19 23 ...
##  $ M45_S140: num  0 0 0 0 0 53 0 0 6 15 ...
##  $ M48_S137: num  0 0 0 0 0 0 0 0 20 16 ...
##  $ M89_S138: num  0 0 0 0 0 0 1 0 8 30 ...
##  $ D55_S146: num  0 0 0 0 0 0 0 0 35 4 ...
##  $ D57_S143: num  0 0 0 0 0 27 0 0 5 20 ...
##  $ D59_S142: num  0 0 0 0 1 0 1 0 6 16 ...
##  $ M46_S141: num  0 0 0 0 0 0 2 0 18 13 ...
##  $ M49_S139: num  0 0 0 0 0 0 1 0 17 15 ...
##  $ M90_S147: num  0 0 0 0 0 31 0 0 18 14 ...
##  $ N48_S194: num  0 0 0 0 0 0 0 0 23 2 ...
##  $ N50_S187: num  0 0 0 0 0 0 1 0 19 9 ...
##  $ N52_S184: num  0 0 0 0 0 30 7 0 0 11 ...
##  $ N54_S193: num  0 0 0 0 0 0 0 0 62 12 ...
##  $ N56_S192: num  0 0 0 0 0 0 0 0 0 0 ...
##  $ N58_S195: num  0 0 0 0 0 0 0 0 24 4 ...
##  $ N49_S185: num  0 0 0 0 0 0 0 0 9 5 ...
##  $ N51_S186: num  0 0 0 0 0 0 0 0 22 13 ...
##  $ N53_S188: num  0 0 18 0 0 0 2 0 15 2 ...
##  $ N55_S190: num  0 0 0 0 0 10 0 0 14 7 ...
##  $ N57_S191: num  0 0 0 0 0 0 1 0 0 5 ...
##  $ N59_S189: num  0 0 0 0 0 0 0 0 0 6 ...

3 Get DEGs based on Desication

This code performs differential expression analysis to identify differentially expressed genes (DEGs) between a control condition and a desiccated condition.

deseq2.colData <- data.frame(condition=factor(c(rep("control", 12), rep("desicated", 12))), 
                             type=factor(rep("single-read", 24)))
rownames(deseq2.colData) <- colnames(data)
deseq2.dds <- DESeqDataSetFromMatrix(countData = countmatrix,
                                     colData = deseq2.colData, 
                                     design = ~ condition)

deseq2.dds <- DESeq(deseq2.dds)
deseq2.res <- results(deseq2.dds)
deseq2.res <- deseq2.res[order(rownames(deseq2.res)), ]

head(deseq2.res)

# Count number of hits with adjusted p-value less then 0.05
dim(deseq2.res[!is.na(deseq2.res$padj) & deseq2.res$padj <= 0.05, ])

4 Making a plot

This code makes a plot where statistally significant values will be highlighted red

tmp <- deseq2.res
# The main plot
plot(tmp$baseMean, tmp$log2FoldChange, pch=20, cex=0.45, ylim=c(-3, 3), log="x", col="darkgray",
     main="DEG Dessication  (pval <= 0.05)",
     xlab="mean of normalized counts",
     ylab="Log2 Fold Change") #This changes the x label, y label, and main title
# Getting the significant points and plotting them again so they're a different color
tmp.sig <- deseq2.res[!is.na(deseq2.res$padj) & deseq2.res$padj <= 0.05, ]
points(tmp.sig$baseMean, tmp.sig$log2FoldChange, pch=20, cex=0.45, col="red")
# 2 FC lines
abline(h=c(-1,1), col="blue")

write.table(tmp.sig, "../output/DEGlist.tab", row.names = T)

LS0tCnRpdGxlOiAiUk5BU2VxIFBpcGxpbmUsIGJ1dCBtYWtlIGl0IHByZXR0eSIKYXV0aG9yOiBTYXJhaCBZZXJyYWNlCmRhdGU6ICJgciBmb3JtYXQoU3lzLnRpbWUoKSwgJyVkICVCLCAlWScpYCIgIApvdXRwdXQ6IAogIGh0bWxfZG9jdW1lbnQ6CiAgICB0aGVtZTogcmVhZGFibGUKICAgIGhpZ2hsaWdodDogemVuYnVybgogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIG51bWJlcl9zZWN0aW9uczogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93CiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCi0tLQoKIyBTZXQgVXAKCkhlcmUgYXJlIGFsbCB0aGUgcGFja2FnZXMgeW91IHdpbGwgbmVlZCBmb3IgdGhpcyBjb2RlCgpgYGB7ciBzZXR1cCwgaW5jbHVkZT1UUlVFLCBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQpCaW9jTWFuYWdlcjo6aW5zdGFsbCgiREVTZXEyIikKCmxpYnJhcnkoa25pdHIpCmxpYnJhcnkodGlkeXZlcnNlKQpsaWJyYXJ5KGthYmxlRXh0cmEpCmxpYnJhcnkoREVTZXEyKQpsaWJyYXJ5KHBoZWF0bWFwKQpsaWJyYXJ5KFJDb2xvckJyZXdlcikKbGlicmFyeShkYXRhLnRhYmxlKQpsaWJyYXJ5KERUKQpsaWJyYXJ5KEJpb3N0cmluZ3MpCmtuaXRyOjpvcHRzX2NodW5rJHNldCgKICBlY2hvID0gVFJVRSwgICAgICAgICAjIERpc3BsYXkgY29kZSBjaHVua3MKICBldmFsID0gRkFMU0UsICAgICAgICAjIEV2YWx1YXRlIGNvZGUgY2h1bmtzCiAgd2FybmluZyA9IEZBTFNFLCAgICAgIyBIaWRlIHdhcm5pbmdzCiAgbWVzc2FnZSA9IEZBTFNFLCAgICAgIyBIaWRlIG1lc3NhZ2VzCiAgZmlnLndpZHRoID0gNiwgICAgICAgIyBTZXQgcGxvdCB3aWR0aCBpbiBpbmNoZXMKICBmaWcuaGVpZ2h0ID0gNCwgICAgICAjIFNldCBwbG90IGhlaWdodCBpbiBpbmNoZXMKICBmaWcuYWxpZ24gPSAiY2VudGVyIiAjIEFsaWduIHBsb3RzIHRvIHRoZSBjZW50ZXIKKQpgYGAKCiMgQWxpZ25tZW50IHVzaW5nIEthbGxpc3RvCiMjIEdldHRpbmcgc2VxdWVuY2VzCkZpbGUgTG9jYXRpb24KaHR0cHM6Ly9nYW5uZXQuZmlzaC53YXNoaW5ndG9uLmVkdS9zZWFzaGVsbC9idS1naXRodWIvbmItMjAyMy9DZ2lnYXMvZGF0YS9ub3BwLwoKVGhpcyBjaHVuayB1c2VzIHdnZXQgdG8gZG93bmxvYWQgZmlsZXMgZnJvbSB0aGUgZmlsZSBsb2NhdGlvbiB0aGF0IG1hdGNoZXMgYSBnaXZlbiBwYXR0ZXJuLgpJbiB0aGlzIGluc3RhbmNlLCAnKjAwMS5mYXN0cS5neicgZGljdGF0ZXMgdGhlIGZpbGUgdHlwZSBhbmQgdGhlIGxhc3QgcGFydCBvZiB0aGUgZmlsZSBuYW1lLgoKYGBge3IgcHVsbCwgZW5naW5lPSdiYXNoJ30KY2QgLi4vZGF0YSAKd2dldCAtLXJlY3Vyc2l2ZSAtLW5vLXBhcmVudCAtLW5vLWRpcmVjdG9yaWVzIFwKLS1hY2NlcHQgJyowMDEuZmFzdHEuZ3onIFwKaHR0cHM6Ly9nYW5uZXQuZmlzaC53YXNoaW5ndG9uLmVkdS9zZWFzaGVsbC9idS1naXRodWIvbmItMjAyMy9DZ2lnYXMvZGF0YS9ub3BwLwpgYGAKCiMjIE9idGFpbiB0aGUgcmVmZXJlbmNlCldlIG5lZWQgdG8gZ2V0IGEgcmVmZXJlbmNlIHRvIHdoaWNoIHdlIGNhbiBjb21wYXJlIG91ciBzZXF1ZW5jZSBkYXRhCgpgYGB7ciBwdWxscmVmLCBlbmdpbmU9J2Jhc2gnfQpjZCAuLi9kYXRhCmN1cmwgLU8gaHR0cHM6Ly9nYW5uZXQuZmlzaC53YXNoaW5ndG9uLmVkdS9zZWFzaGVsbC9idS1naXRodWIvbmItMjAyMy9DZ2lnYXMvZGF0YS9ybmEuZm5hCmBgYAoKCiMjIEluZGV4IFJlZmVyZW5jZQpUaGlzIGNvZGUgaXMgaW5kZXhpbmcgdGhlIGZpbGUgcm5hLmZuYSB3aGlsZSBhbHNvIHJlbmFtaW5nIGl0IGFzIGNnaWdhc19yb3NsaW5fcm5hLmluZGV4CgpgYGB7ciBrYWxsaXN0bywgZW5naW5lPSdiYXNoJ30KL2hvbWUvc2hhcmVkL2thbGxpc3RvL2thbGxpc3RvIFwKaW5kZXggLWkgXAouLi9kYXRhL2NnaWdhc19yb3NsaW5fcm5hLmluZGV4IFwKLi4vZGF0YS9ybmEuZm5hCmBgYAoKCiMjIEFsaWduIHJlYWRzClRoaXMgY29kZSBhbGxpZ25zIHRoZSBzZXF1ZW5jZXMKCmBgYHtyIGthbGxpc3RvLWFsaWduLCBlbmdpbmU9J2Jhc2gnfQpta2RpciAuLi9vdXRwdXQva2FsbGlzdG9fMDEKZmluZCAuLi9kYXRhLypfTDAwMV9SMV8wMDEuZmFzdHEuZ3ogXAp8IHhhcmdzIGJhc2VuYW1lIC1zIF9MMDAxX1IxXzAwMS5mYXN0cS5neiB8IHhhcmdzIC1Je30gL2hvbWUvc2hhcmVkL2thbGxpc3RvL2thbGxpc3RvIFwKcXVhbnQgLWkgLi4vZGF0YS9jZ2lnYXNfcm9zbGluX3JuYS5pbmRleCBcCi1vIC4uL291dHB1dC9rYWxsaXN0b18wMS97fSBcCi10IDQwIFwKLS1zaW5nbGUgLWwgMTAwIC1zIDEwIC4uL2RhdGEve31fTDAwMV9SMV8wMDEuZmFzdHEuZ3oKYGBgCgpUaGlzIGNvbW1hbmQgcnVucyB0aGUgYWJ1bmRhbmNlX2VzdGltYXRlc190b19tYXRyaXgucGwgc2NyaXB0IGZyb20gdGhlIFRyaW5pdHkgUk5BLXNlcSBhc3NlbWJseSBzb2Z0d2FyZSBwYWNrYWdlIHRvIGNyZWF0ZSBhIGdlbmUgZXhwcmVzc2lvbiBtYXRyaXggZnJvbSBrYWxsaXN0byBvdXRwdXQgZmlsZXMuCgpgYGB7YmFzaH0KcGVybCAvaG9tZS9zaGFyZWQvdHJpbml0eXJuYXNlcS12Mi4xMi4wL3V0aWwvYWJ1bmRhbmNlX2VzdGltYXRlc190b19tYXRyaXgucGwgXAotLWVzdF9tZXRob2Qga2FsbGlzdG8gXAogICAgLS1nZW5lX3RyYW5zX21hcCBub25lIFwKICAgIC0tb3V0X3ByZWZpeCAuLi9vdXRwdXQva2FsbGlzdG9fMDEgXAogICAgLS1uYW1lX3NhbXBsZV9ieV9iYXNlZGlyIFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ENTRfUzE0NS9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ENTZfUzEzNi9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ENThfUzE0NC9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9NNDVfUzE0MC9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9NNDhfUzEzNy9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9NODlfUzEzOC9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ENTVfUzE0Ni9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ENTdfUzE0My9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ENTlfUzE0Mi9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9NNDZfUzE0MS9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9NNDlfUzEzOS9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9NOTBfUzE0Ny9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONDhfUzE5NC9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTBfUzE4Ny9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTJfUzE4NC9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTRfUzE5My9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTZfUzE5Mi9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONThfUzE5NS9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONDlfUzE4NS9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTFfUzE4Ni9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTNfUzE4OC9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTVfUzE5MC9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTdfUzE5MS9hYnVuZGFuY2UudHN2IFwKICAgIC4uL291dHB1dC9rYWxsaXN0b18wMS9ONTlfUzE4OS9hYnVuZGFuY2UudHN2CmBgYAoKIyMjIFJlYWQgaW4gQ291bnQgbWF0cml4ClJlYWRzIGluIGEgY291bnQgbWF0cml4IG9mIGlzb2Zvcm0gY291bnRzIGdlbmVyYXRlZCBieSBLYWxsaXN0bywgd2l0aCByb3cgbmFtZXMgc2V0IHRvIHRoZSBnZW5lL3RyYW5zY3JpcHQgSURzIGFuZCB0aGUgZmlyc3QgY29sdW1uIHJlbW92ZWQuIAoKYGBge3IsIGV2YWw9VFJVRX0KY291bnRtYXRyaXggPC0gcmVhZC5kZWxpbSgiLi4vb3V0cHV0L2thbGxpc3RvXzAxLmlzb2Zvcm0uY291bnRzLm1hdHJpeCIsIGhlYWRlciA9IFRSVUUsIHNlcCA9ICdcdCcpCnJvd25hbWVzKGNvdW50bWF0cml4KSA8LSBjb3VudG1hdHJpeCRYCmNvdW50bWF0cml4IDwtIGNvdW50bWF0cml4WywtMV0KaGVhZChjb3VudG1hdHJpeCkKYGBgCgojIyMgUm91bmQgaW50ZWdlcnMgdG8gd2hvbGUgbnVtYmVycwpSb3VuZHMgdGhlIGNvdW50cyB0byB3aG9sZSBudW1iZXJzIGZvciBmdXJ0aGVyIGFuYWx5c2lzCgpgYGB7ciwgIGV2YWw9VFJVRX0KY291bnRtYXRyaXggPC0gcm91bmQoY291bnRtYXRyaXgsIDApCnN0cihjb3VudG1hdHJpeCkKYGBgCgojIEdldCBERUdzIGJhc2VkIG9uIERlc2ljYXRpb24KClRoaXMgY29kZSBwZXJmb3JtcyBkaWZmZXJlbnRpYWwgZXhwcmVzc2lvbiBhbmFseXNpcyB0byBpZGVudGlmeSBkaWZmZXJlbnRpYWxseSBleHByZXNzZWQgZ2VuZXMgKERFR3MpIGJldHdlZW4gYSBjb250cm9sIGNvbmRpdGlvbiBhbmQgYSBkZXNpY2NhdGVkIGNvbmRpdGlvbi4KCgpgYGB7ciwgZXZhbD1UUlVFfQpkZXNlcTIuY29sRGF0YSA8LSBkYXRhLmZyYW1lKGNvbmRpdGlvbj1mYWN0b3IoYyhyZXAoImNvbnRyb2wiLCAxMiksIHJlcCgiZGVzaWNhdGVkIiwgMTIpKSksIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgIHR5cGU9ZmFjdG9yKHJlcCgic2luZ2xlLXJlYWQiLCAyNCkpKQpyb3duYW1lcyhkZXNlcTIuY29sRGF0YSkgPC0gY29sbmFtZXMoZGF0YSkKZGVzZXEyLmRkcyA8LSBERVNlcURhdGFTZXRGcm9tTWF0cml4KGNvdW50RGF0YSA9IGNvdW50bWF0cml4LAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgY29sRGF0YSA9IGRlc2VxMi5jb2xEYXRhLCAKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGRlc2lnbiA9IH4gY29uZGl0aW9uKQpgYGAKCmBgYHtyLCAgZXZhbD1UUlVFLCBjYWNoZT1UUlVFfQpkZXNlcTIuZGRzIDwtIERFU2VxKGRlc2VxMi5kZHMpCmRlc2VxMi5yZXMgPC0gcmVzdWx0cyhkZXNlcTIuZGRzKQpkZXNlcTIucmVzIDwtIGRlc2VxMi5yZXNbb3JkZXIocm93bmFtZXMoZGVzZXEyLnJlcykpLCBdCmBgYAoKYGBge3J9CmhlYWQoZGVzZXEyLnJlcykKYGBgCgpgYGB7cn0KIyBDb3VudCBudW1iZXIgb2YgaGl0cyB3aXRoIGFkanVzdGVkIHAtdmFsdWUgbGVzcyB0aGVuIDAuMDUKZGltKGRlc2VxMi5yZXNbIWlzLm5hKGRlc2VxMi5yZXMkcGFkaikgJiBkZXNlcTIucmVzJHBhZGogPD0gMC4wNSwgXSkKYGBgCgojIE1ha2luZyBhIHBsb3QKVGhpcyBjb2RlIG1ha2VzIGEgcGxvdCB3aGVyZSBzdGF0aXN0YWxseSBzaWduaWZpY2FudCB2YWx1ZXMgd2lsbCBiZSBoaWdobGlnaHRlZCByZWQKCmBgYHtyIHBsb3QsIGV2YWw9VFJVRSwgcmVzdWx0cz0nbWFya2Rvd24nLCBpbmNsdWRlPVRSVUV9CnRtcCA8LSBkZXNlcTIucmVzCiMgVGhlIG1haW4gcGxvdApwbG90KHRtcCRiYXNlTWVhbiwgdG1wJGxvZzJGb2xkQ2hhbmdlLCBwY2g9MjAsIGNleD0wLjQ1LCB5bGltPWMoLTMsIDMpLCBsb2c9IngiLCBjb2w9ImRhcmtncmF5IiwKICAgICBtYWluPSJERUcgRGVzc2ljYXRpb24gIChwdmFsIDw9IDAuMDUpIiwKICAgICB4bGFiPSJtZWFuIG9mIG5vcm1hbGl6ZWQgY291bnRzIiwKICAgICB5bGFiPSJMb2cyIEZvbGQgQ2hhbmdlIikgI1RoaXMgY2hhbmdlcyB0aGUgeCBsYWJlbCwgeSBsYWJlbCwgYW5kIG1haW4gdGl0bGUKIyBHZXR0aW5nIHRoZSBzaWduaWZpY2FudCBwb2ludHMgYW5kIHBsb3R0aW5nIHRoZW0gYWdhaW4gc28gdGhleSdyZSBhIGRpZmZlcmVudCBjb2xvcgp0bXAuc2lnIDwtIGRlc2VxMi5yZXNbIWlzLm5hKGRlc2VxMi5yZXMkcGFkaikgJiBkZXNlcTIucmVzJHBhZGogPD0gMC4wNSwgXQpwb2ludHModG1wLnNpZyRiYXNlTWVhbiwgdG1wLnNpZyRsb2cyRm9sZENoYW5nZSwgcGNoPTIwLCBjZXg9MC40NSwgY29sPSJyZWQiKQojIDIgRkMgbGluZXMKYWJsaW5lKGg9YygtMSwxKSwgY29sPSJibHVlIikKYGBgCgpgYGB7cn0Kd3JpdGUudGFibGUodG1wLnNpZywgIi4uL291dHB1dC9ERUdsaXN0LnRhYiIsIHJvdy5uYW1lcyA9IFQpCmBgYAo=

RNASeq Pipline, but make it pretty

Sarah Yerrace

14 April, 2023