Use ShortStack (Axtell 2013; Johnson et al. 2016; Shahid and Axtell 2014) to perform alignment of sRNAseq data and annotation of sRNA-producing genes.

Inputs:

Requires trimmed sRNAseq files generated by 06-Peve-sRNAseq-trimming.Rmd
- Filenames formatted: *flexbar_trim.25bp*.gz
A.millepora genome FastA. See 07-Peve-sRNAseq-MirMachine.md for download info if needed.

Outputs:

See ShortStack outputs documentation for full list and detailed descriptions.

Software requirements:

Utilizes a ShortStack Conda/Mamba environment, per the installation instructions.

Replace with name of your ShortStack environment and the path to the corresponding conda installation (find this after you’ve activated the environment).

E.g.

# Activate environment
conda activate ShortStack4_env

# Find conda path
which conda

1 Set R variables

shortstack_conda_env_name <- c("ShortStack4_env")
shortstack_cond_path <- c("/home/sam/programs/mambaforge/condabin/conda")

2 Create a Bash variables file

This allows usage of Bash variables across R Markdown chunks.

{
echo "#### Assign Variables ####"
echo ""

echo "# Trimmed FastQ naming pattern"
echo "export trimmed_fastqs_pattern='*flexbar_trim.25bp*.fastq.gz'"

echo "# Data directories"
echo 'export deep_dive_dir=/home/shared/8TB_HDD_01/sam/gitrepos/deep-dive'
echo 'export deep_dive_data_dir="${deep_dive_dir}/data"'
echo 'export output_dir_top=${deep_dive_dir}/E-Peve/output/08-Peve-sRNAseq-ShortStack'
echo 'export trimmed_fastqs_dir="${deep_dive_dir}/E-Peve/output/06-Peve-sRNAseq-trimming/trimmed-reads"'
echo ""

echo "# Input/Output files"
echo 'export genome_fasta_dir=${deep_dive_dir}/E-Peve/data'
echo 'export genome_fasta_name="Porites_evermanni_v1.fa"'
echo 'export shortstack_genome_fasta_name="Porites_evermanni_v1.fa"'
echo 'export mirbase_mature_fasta=mature.fa'
echo 'export mirbase_mature_fasta_version=mirbase-mature-v22.1.fa'
echo 'export genome_fasta="${genome_fasta_dir}/${shortstack_genome_fasta_name}"'
echo ""

echo "# External data URLs"
echo 'export mirbase_fasta_url="https://mirbase.org/download_version_files/22.1/"'
echo ""

echo "# Set number of CPUs to use"
echo 'export threads=46'
echo ""

echo "# Initialize arrays"
echo 'export trimmed_fastqs_array=()'


} > .bashvars

cat .bashvars

#### Assign Variables ####

# Trimmed FastQ naming pattern
export trimmed_fastqs_pattern='*flexbar_trim.25bp*.fastq.gz'
# Data directories
export deep_dive_dir=/home/shared/8TB_HDD_01/sam/gitrepos/deep-dive
export deep_dive_data_dir="${deep_dive_dir}/data"
export output_dir_top=${deep_dive_dir}/E-Peve/output/08-Peve-sRNAseq-ShortStack
export trimmed_fastqs_dir="${deep_dive_dir}/E-Peve/output/06-Peve-sRNAseq-trimming/trimmed-reads"

# Input/Output files
export genome_fasta_dir=${deep_dive_dir}/E-Peve/data
export genome_fasta_name="Porites_evermanni_v1.fa"
export shortstack_genome_fasta_name="Porites_evermanni_v1.fa"
export mirbase_mature_fasta=mature.fa
export mirbase_mature_fasta_version=mirbase-mature-v22.1.fa
export genome_fasta="${genome_fasta_dir}/${shortstack_genome_fasta_name}"

# External data URLs
export mirbase_fasta_url="https://mirbase.org/download_version_files/22.1/"

# Set number of CPUs to use
export threads=46

# Initialize arrays
export trimmed_fastqs_array=()

3 Load ShortStack conda environment

If this is successful, the first line of output should show that the Python being used is the one in your [ShortStack](https://github.com/MikeAxtell/ShortStack conda environment path.

E.g.

python: /home/sam/programs/mambaforge/envs/mirmachine_env/bin/python

use_condaenv(condaenv = shortstack_conda_env_name, conda = shortstack_cond_path)

# Check successful env loading
py_config()

python:         /home/sam/programs/mambaforge/envs/ShortStack4_env/bin/python
libpython:      /home/sam/programs/mambaforge/envs/ShortStack4_env/lib/libpython3.10.so
pythonhome:     /home/sam/programs/mambaforge/envs/ShortStack4_env:/home/sam/programs/mambaforge/envs/ShortStack4_env
version:        3.10.13 | packaged by conda-forge | (main, Oct 26 2023, 18:07:37) [GCC 12.3.0]
numpy:          /home/sam/programs/mambaforge/envs/ShortStack4_env/lib/python3.10/site-packages/numpy
numpy_version:  1.26.0

NOTE: Python version was forced by use_python() function

4 Download miRBase mature miRNA FastA

# Load bash variables into memory
source .bashvars

wget \
--directory-prefix ${deep_dive_data_dir} \
--recursive \
--no-check-certificate \
--continue \
--no-host-directories \
--no-directories \
--no-parent \
--quiet \
--execute robots=off \
 ${mirbase_fasta_url}/${mirbase_mature_fasta}

# Rename to indicate miRBase FastA version
mv ${deep_dive_data_dir}/${mirbase_mature_fasta} ${deep_dive_data_dir}/${mirbase_mature_fasta_version}

ls -lh "${deep_dive_data_dir}"

total 13M
drwxr-xr-x 2 sam sam 4.0K Nov  7 14:36 blast_dbs
-rw-r--r-- 1 sam sam 3.7M Nov 15 21:30 mirbase-mature-v22.1.fa
-rw-r--r-- 1 sam sam 3.7M Nov 14 09:39 mirbase-mature-v22.1-no_spaces.fa
-rw-r--r-- 1 sam sam 3.7M Nov  7 14:31 mirbase-mature-v22.1-no_U.fa
-rw-r--r-- 1 sam sam 726K Nov  7 14:36 mirgene-mature-all-v2.1.fa
-rw-r--r-- 1 sam sam 726K Nov  7 14:31 mirgene-mature-all-v2.1-no_U.fa

5 Run ShortStack

5.1 Excecute ShortStack command

Uses the --dn_mirna option to identify miRNAs in the genome, without relying on the --known_miRNAs.

This part of the code redirects the output of time to the end of shortstack.log file.

; } \ 2>> ${output_dir_top}/shortstack.log

# Load bash variables into memory
source .bashvars

# Create array of trimmed FastQs
trimmed_fastqs_array=(${trimmed_fastqs_dir}/${trimmed_fastqs_pattern})


# Pass array contents to new variable as space-delimited list
trimmed_fastqs_list=$(echo "${trimmed_fastqs_array[*]}")


###### Run ShortStack ######
{ time \
ShortStack \
--genomefile "${genome_fasta}" \
--readfile ${trimmed_fastqs_list} \
--known_miRNAs ${deep_dive_data_dir}/${mirbase_mature_fasta_version} \
--dn_mirna \
--threads ${threads} \
--outdir ${output_dir_top}/ShortStack_out \
&> ${output_dir_top}/shortstack.log ; } \
2>> ${output_dir_top}/shortstack.log

5.2 Check runtime

# Load bash variables into memory
source .bashvars

tail -n 3 ${output_dir_top}/shortstack.log \
| grep "real" \
| awk '{print "ShortStack runtime:" "\t" $2}'

ShortStack runtime: 75m11.616s

6 Results

6.1 ShortStack synopsis

# Load bash variables into memory
source .bashvars

tail -n 20 ${output_dir_top}/shortstack.log


Screening of possible de novo microRNAs

No microRNA loci were found!

Writing final files

Non-MIRNA loci by DicerCall:
N 14896
22 56
23 43
24 24
21 21

Wed 15 Nov 2023 20:35:51 -0800 PST
Run Completed!

real    75m11.616s
user    1670m15.527s
sys 461m28.418s

ShortStack didn’t identify any miRNAs.

6.2 Inspect `Results.txt`

# Load bash variables into memory
source .bashvars

head ${output_dir_top}/ShortStack_out/Results.txt

echo ""
echo "----------------------------------------------------------"
echo ""

echo "Nummber of potential loci:"
awk '(NR>1)' ${output_dir_top}/ShortStack_out/Results.txt | wc -l

Locus   Name    Chrom   Start   End Length  Reads   UniqueReads FracTop Strand  MajorRNA    MajorRNAReads   Short   Long    21  22  23  24  DicerCall   MIRNA   known_miRNAs
Porites_evermani_scaffold_1:45716-46125 Cluster_1   Porites_evermani_scaffold_1 45716   46125   410 215 93  0.49767441860465117 .   ACUGAUUCUUGGCCACCUCUACUGU   9   45  96  18  16  18  22  N   N   NA
Porites_evermani_scaffold_1:406307-406731   Cluster_2   Porites_evermani_scaffold_1 406307  406731  425 340 103 0.5029411764705882  .   UGAGUGUAUUCUUGAACUGUUUUCC   73  2   314 2   1   9   12  N   N   NA
Porites_evermani_scaffold_1:409840-410269   Cluster_3   Porites_evermani_scaffold_1 409840  410269  430 365 55  0.4876712328767123  .   UGGAACUCCGAUUUAGAACUUGCAA   124 0   355 1   3   0   6   N   N   NA
Porites_evermani_scaffold_1:465246-465668   Cluster_4   Porites_evermani_scaffold_1 465246  465668  423 371 97  0.49326145552560646 .   AAGUUGCUCUGAAGAUUAUGU   39  66  140 96  15  40  14  N   N   NA
Porites_evermani_scaffold_1:468473-468950   Cluster_5   Porites_evermani_scaffold_1 468473  468950  478 231785  1297    0.49824190521388356 .   AAUUCAGAAAAACUGAACAGUCAUC   89861   3892    224933  229 276 305 2150    N   N   NA
Porites_evermani_scaffold_1:476827-477250   Cluster_6   Porites_evermani_scaffold_1 476827  477250  424 241 67  0.4896265560165975  .   CGUGUCUUCGUAAUCGUCUCGUACA   14  66  85  0   24  30  36  N   N   NA
Porites_evermani_scaffold_1:486444-486864   Cluster_7   Porites_evermani_scaffold_1 486444  486864  421 116 17  0.49137931034482757 .   AUAUUGACGAAUCCUGGCCUAGUGA   49  0   108 0   0   8   0   N   N   NA
Porites_evermani_scaffold_1:534428-534866   Cluster_8   Porites_evermani_scaffold_1 534428  534866  439 1252    200 0.4976038338658147  .   AGCCAAAGCUAUAAGUUUACGUCUC   298 62  892 120 28  70  80  N   N   NA
Porites_evermani_scaffold_1:729098-729587   Cluster_9   Porites_evermani_scaffold_1 729098  729587  490 13328   605 0.49797418967587037 .   UGUGGUCAGACAGUUCUGGCUUGUC   4355    409 11693   262 478 244 242 N   N   NA

----------------------------------------------------------

Nummber of potential loci:
15040

Column 20 of the Results.txt file identifies if a cluster is a miRNA or not (Y or N).

# Load bash variables into memory
source .bashvars

echo "Number of loci characterized as miRNA:"
awk '$20=="Y" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l
echo ""

echo "----------------------------------------------------------"

echo ""
echo "Number of loci _not_ characterized as miRNA:"
awk '$20=="N" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l

Number of loci characterized as miRNA:
0

----------------------------------------------------------

Number of loci _not_ characterized as miRNA:
15040

Column 21 of the Results.txt file identifies if a cluster aligned to a known miRNA (miRBase) or not (Y or NA).

Since there are no miRNAs, the following code will not print any output.

The echo command after the awk command is simply there to prove that the chunk executed.

# Load bash variables into memory
source .bashvars

echo "Number of loci matching miRBase miRNAs:"
awk '$21!="NA" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l
echo ""

echo "----------------------------------------------------------"

echo ""
echo "Number of loci _not_ matching miRBase miRNAs:"
awk '$21=="NA" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l

Number of loci matching miRBase miRNAs:
25

----------------------------------------------------------

Number of loci _not_ matching miRBase miRNAs:
15016

Although there are loci with matches to miRBase miRNAs, ShortStack did not annotate these clusters as miRNAs likely because they do not also match secondary structure criteria.

6.2.1 Directory tree of all ShortStack outputs

Many of these are large (by GitHub standards) BAM files, so will not be added to the repo.

Additionally, it’s unlikely we’ll utilize most of the other files (bigwig) generated by ShortStack.

# Load bash variables into memory
source .bashvars

tree -h ${output_dir_top}/

/home/shared/8TB_HDD_01/sam/gitrepos/deep-dive/E-Peve/output/08-Peve-sRNAseq-ShortStack/
├── [ 21K]  shortstack.log
└── [228K]  ShortStack_out
    ├── [ 28K]  alignment_details.tsv
    ├── [1.1M]  Counts.txt
    ├── [204K]  known_miRNAs.gff3
    ├── [1.8M]  known_miRNAs_unaligned.fasta
    ├── [ 11M]  merged_alignments_21_m.bw
    ├── [ 11M]  merged_alignments_21_p.bw
    ├── [ 10M]  merged_alignments_22_m.bw
    ├── [ 10M]  merged_alignments_22_p.bw
    ├── [ 17M]  merged_alignments_23-24_m.bw
    ├── [ 17M]  merged_alignments_23-24_p.bw
    ├── [1.3G]  merged_alignments.bam
    ├── [348K]  merged_alignments.bam.csi
    ├── [ 77M]  merged_alignments_other_m.bw
    ├── [ 79M]  merged_alignments_other_p.bw
    ├── [ 32M]  merged_alignments_sRNA-POR-73-S1-TP2.flexbar_trim.25bp_1.bw
    ├── [ 33M]  merged_alignments_sRNA-POR-73-S1-TP2.flexbar_trim.25bp_2.bw
    ├── [ 45M]  merged_alignments_sRNA-POR-79-S1-TP2.flexbar_trim.25bp_1.bw
    ├── [ 45M]  merged_alignments_sRNA-POR-79-S1-TP2.flexbar_trim.25bp_2.bw
    ├── [ 51M]  merged_alignments_sRNA-POR-82-S1-TP2.flexbar_trim.25bp_1.bw
    ├── [ 51M]  merged_alignments_sRNA-POR-82-S1-TP2.flexbar_trim.25bp_2.bw
    ├── [1.7M]  Results.gff3
    ├── [2.6M]  Results.txt
    ├── [200M]  sRNA-POR-73-S1-TP2.flexbar_trim.25bp_1.bam
    ├── [303K]  sRNA-POR-73-S1-TP2.flexbar_trim.25bp_1.bam.csi
    ├── [206M]  sRNA-POR-73-S1-TP2.flexbar_trim.25bp_2.bam
    ├── [304K]  sRNA-POR-73-S1-TP2.flexbar_trim.25bp_2.bam.csi
    ├── [219M]  sRNA-POR-79-S1-TP2.flexbar_trim.25bp_1.bam
    ├── [309K]  sRNA-POR-79-S1-TP2.flexbar_trim.25bp_1.bam.csi
    ├── [228M]  sRNA-POR-79-S1-TP2.flexbar_trim.25bp_2.bam
    ├── [310K]  sRNA-POR-79-S1-TP2.flexbar_trim.25bp_2.bam.csi
    ├── [243M]  sRNA-POR-82-S1-TP2.flexbar_trim.25bp_1.bam
    ├── [314K]  sRNA-POR-82-S1-TP2.flexbar_trim.25bp_1.bam.csi
    ├── [251M]  sRNA-POR-82-S1-TP2.flexbar_trim.25bp_2.bam
    └── [315K]  sRNA-POR-82-S1-TP2.flexbar_trim.25bp_2.bam.csi

1 directory, 35 files

Citations

Axtell, Michael J. 2013. “ShortStack: Comprehensive Annotation and Quantification of Small RNA Genes.” RNA 19 (6): 740–51.

Johnson, Nathan R, Jonathan M Yeoh, Ceyda Coruh, and Michael J Axtell. 2016. “Improved Placement of Multi-Mapping Small RNAs.” G3 Genes|Genomes|Genetics 6 (7): 2103–11. https://doi.org/10.1534/g3.116.030452.

Shahid, Saima, and Michael J Axtell. 2014. “Identification and Annotation of Small RNA Genes Using ShortStack.” Methods 67 (1): 20–27.

LS0tCnRpdGxlOiAiMDgtUGV2ZS1zUk5Bc2VxLVNob3J0U3RhY2siCmF1dGhvcjogIlNhbSBXaGl0ZSIKZGF0ZTogIjIwMjMtMTEtMTUiCm91dHB1dDogCiAgYm9va2Rvd246Omh0bWxfZG9jdW1lbnQyOgogICAgdGhlbWU6IGNvc21vCiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgbnVtYmVyX3NlY3Rpb25zOiB0cnVlCiAgICBjb2RlX2ZvbGRpbmc6IHNob3cKICAgIGNvZGVfZG93bmxvYWQ6IHRydWUKICBnaXRodWJfZG9jdW1lbnQ6CiAgICB0b2M6IHRydWUKICAgIG51bWJlcl9zZWN0aW9uczogdHJ1ZQogIGh0bWxfZG9jdW1lbnQ6CiAgICB0aGVtZTogY29zbW8KICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OiB0cnVlCiAgICBudW1iZXJfc2VjdGlvbnM6IHRydWUKICAgIGNvZGVfZm9sZGluZzogc2hvdwogICAgY29kZV9kb3dubG9hZDogdHJ1ZQpiaWJsaW9ncmFwaHk6IHJlZmVyZW5jZXMuYmliCmxpbmstY2l0YXRpb25zOiB0cnVlCi0tLQoKYGBge3Igc2V0dXAsIGluY2x1ZGU9RkFMU0V9CmxpYnJhcnkoa25pdHIpCmxpYnJhcnkoa2FibGVFeHRyYSkKbGlicmFyeShkcGx5cikKbGlicmFyeShyZXRpY3VsYXRlKQprbml0cjo6b3B0c19jaHVuayRzZXQoCiAgZWNobyA9IFRSVUUsICAgICAgICAgIyBEaXNwbGF5IGNvZGUgY2h1bmtzCiAgZXZhbCA9IEZBTFNFLCAgICAgICAgIyBFdmFsdWF0ZSBjb2RlIGNodW5rcwogIHdhcm5pbmcgPSBGQUxTRSwgICAgICMgSGlkZSB3YXJuaW5ncwogIG1lc3NhZ2UgPSBGQUxTRSwgICAgICMgSGlkZSBtZXNzYWdlcwogIGNvbW1lbnQgPSAiIiAgICAgICAgICMgUHJldmVudHMgYXBwZW5kaW5nICcjIycgdG8gYmVnaW5uaW5nIG9mIGxpbmVzIGluIGNvZGUgb3V0cHV0CikKYGBgCgpVc2UgW1Nob3J0U3RhY2tdKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2spIFtAQXh0ZWxsMjAxMy14dTsgQGpvaG5zb24yMDE2OyBAU2hhaGlkMjAxNC1seF0gdG8gcGVyZm9ybSBhbGlnbm1lbnQgb2Ygc1JOQXNlcSBkYXRhIGFuZCBhbm5vdGF0aW9uIG9mIHNSTkEtcHJvZHVjaW5nIGdlbmVzLgoKLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tCgpJbnB1dHM6CgotICAgUmVxdWlyZXMgdHJpbW1lZCBzUk5Bc2VxIGZpbGVzIGdlbmVyYXRlZCBieSBbMDYtUGV2ZS1zUk5Bc2VxLXRyaW1taW5nLlJtZF0oaHR0cHM6Ly9naXRodWIuY29tL3Vyb2wtZTUvZGVlcC1kaXZlL2Jsb2IvbWFpbi9FLVBldmUvY29kZS8wNi1QZXZlLXNSTkFzZXEtdHJpbW1pbmcuUm1kKQoKICAgIC0gICBGaWxlbmFtZXMgZm9ybWF0dGVkOiBgKmZsZXhiYXJfdHJpbS4yNWJwKi5nemAKCi0gICAqQS5taWxsZXBvcmEqIGdlbm9tZSBGYXN0QS4gU2VlIFswNy1QZXZlLXNSTkFzZXEtTWlyTWFjaGluZS5tZF0oaHR0cHM6Ly9naXRodWIuY29tL3Vyb2wtZTUvZGVlcC1kaXZlL2Jsb2IvbWFpbi9FLVBldmUvY29kZS8wNy1QZXZlLXNSTkFzZXEtTWlyTWFjaGluZS5tZCkgZm9yIGRvd25sb2FkIGluZm8gaWYgbmVlZGVkLgoKT3V0cHV0czoKCi0gICBTZWUgW1Nob3J0U3RhY2sgb3V0cHV0cyBkb2N1bWVudGF0aW9uXShodHRwczovL2dpdGh1Yi5jb20vTWlrZUF4dGVsbC9TaG9ydFN0YWNrI291dHB1dHMpIGZvciBmdWxsIGxpc3QgYW5kIGRldGFpbGVkIGRlc2NyaXB0aW9ucy4KClNvZnR3YXJlIHJlcXVpcmVtZW50czoKCi0gICBVdGlsaXplcyBhIFtTaG9ydFN0YWNrXShodHRwczovL2dpdGh1Yi5jb20vTWlrZUF4dGVsbC9TaG9ydFN0YWNrI2luc3RhbGxhdGlvbikgQ29uZGEvTWFtYmEgZW52aXJvbm1lbnQsIHBlciB0aGUgaW5zdGFsbGF0aW9uIGluc3RydWN0aW9ucy4KClJlcGxhY2Ugd2l0aCBuYW1lIG9mIHlvdXIgU2hvcnRTdGFjayBlbnZpcm9ubWVudCBhbmQgdGhlIHBhdGggdG8gdGhlIGNvcnJlc3BvbmRpbmcgY29uZGEgaW5zdGFsbGF0aW9uIChmaW5kIHRoaXMgKmFmdGVyKiB5b3UndmUgYWN0aXZhdGVkIHRoZSBlbnZpcm9ubWVudCkuCgpFLmcuCgpgYGAgYmFzaAojIEFjdGl2YXRlIGVudmlyb25tZW50CmNvbmRhIGFjdGl2YXRlIFNob3J0U3RhY2s0X2VudgoKIyBGaW5kIGNvbmRhIHBhdGgKd2hpY2ggY29uZGEKYGBgCgotLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KCiMgU2V0IFIgdmFyaWFibGVzCgpgYGB7ciBSLXZhcmlhYmxlcywgZXZhbD1UUlVFfQpzaG9ydHN0YWNrX2NvbmRhX2Vudl9uYW1lIDwtIGMoIlNob3J0U3RhY2s0X2VudiIpCnNob3J0c3RhY2tfY29uZF9wYXRoIDwtIGMoIi9ob21lL3NhbS9wcm9ncmFtcy9tYW1iYWZvcmdlL2NvbmRhYmluL2NvbmRhIikKYGBgCgojIENyZWF0ZSBhIEJhc2ggdmFyaWFibGVzIGZpbGUKClRoaXMgYWxsb3dzIHVzYWdlIG9mIEJhc2ggdmFyaWFibGVzIGFjcm9zcyBSIE1hcmtkb3duIGNodW5rcy4KCmBgYHtyIHNhdmUtYmFzaC12YXJpYWJsZXMtdG8tcnZhcnMtZmlsZSwgZW5naW5lPSdiYXNoJywgZXZhbD1UUlVFfQp7CmVjaG8gIiMjIyMgQXNzaWduIFZhcmlhYmxlcyAjIyMjIgplY2hvICIiCgplY2hvICIjIFRyaW1tZWQgRmFzdFEgbmFtaW5nIHBhdHRlcm4iCmVjaG8gImV4cG9ydCB0cmltbWVkX2Zhc3Rxc19wYXR0ZXJuPScqZmxleGJhcl90cmltLjI1YnAqLmZhc3RxLmd6JyIKCmVjaG8gIiMgRGF0YSBkaXJlY3RvcmllcyIKZWNobyAnZXhwb3J0IGRlZXBfZGl2ZV9kaXI9L2hvbWUvc2hhcmVkLzhUQl9IRERfMDEvc2FtL2dpdHJlcG9zL2RlZXAtZGl2ZScKZWNobyAnZXhwb3J0IGRlZXBfZGl2ZV9kYXRhX2Rpcj0iJHtkZWVwX2RpdmVfZGlyfS9kYXRhIicKZWNobyAnZXhwb3J0IG91dHB1dF9kaXJfdG9wPSR7ZGVlcF9kaXZlX2Rpcn0vRS1QZXZlL291dHB1dC8wOC1QZXZlLXNSTkFzZXEtU2hvcnRTdGFjaycKZWNobyAnZXhwb3J0IHRyaW1tZWRfZmFzdHFzX2Rpcj0iJHtkZWVwX2RpdmVfZGlyfS9FLVBldmUvb3V0cHV0LzA2LVBldmUtc1JOQXNlcS10cmltbWluZy90cmltbWVkLXJlYWRzIicKZWNobyAiIgoKZWNobyAiIyBJbnB1dC9PdXRwdXQgZmlsZXMiCmVjaG8gJ2V4cG9ydCBnZW5vbWVfZmFzdGFfZGlyPSR7ZGVlcF9kaXZlX2Rpcn0vRS1QZXZlL2RhdGEnCmVjaG8gJ2V4cG9ydCBnZW5vbWVfZmFzdGFfbmFtZT0iUG9yaXRlc19ldmVybWFubmlfdjEuZmEiJwplY2hvICdleHBvcnQgc2hvcnRzdGFja19nZW5vbWVfZmFzdGFfbmFtZT0iUG9yaXRlc19ldmVybWFubmlfdjEuZmEiJwplY2hvICdleHBvcnQgbWlyYmFzZV9tYXR1cmVfZmFzdGE9bWF0dXJlLmZhJwplY2hvICdleHBvcnQgbWlyYmFzZV9tYXR1cmVfZmFzdGFfdmVyc2lvbj1taXJiYXNlLW1hdHVyZS12MjIuMS5mYScKZWNobyAnZXhwb3J0IGdlbm9tZV9mYXN0YT0iJHtnZW5vbWVfZmFzdGFfZGlyfS8ke3Nob3J0c3RhY2tfZ2Vub21lX2Zhc3RhX25hbWV9IicKZWNobyAiIgoKZWNobyAiIyBFeHRlcm5hbCBkYXRhIFVSTHMiCmVjaG8gJ2V4cG9ydCBtaXJiYXNlX2Zhc3RhX3VybD0iaHR0cHM6Ly9taXJiYXNlLm9yZy9kb3dubG9hZF92ZXJzaW9uX2ZpbGVzLzIyLjEvIicKZWNobyAiIgoKZWNobyAiIyBTZXQgbnVtYmVyIG9mIENQVXMgdG8gdXNlIgplY2hvICdleHBvcnQgdGhyZWFkcz00NicKZWNobyAiIgoKZWNobyAiIyBJbml0aWFsaXplIGFycmF5cyIKZWNobyAnZXhwb3J0IHRyaW1tZWRfZmFzdHFzX2FycmF5PSgpJwoKCn0gPiAuYmFzaHZhcnMKCmNhdCAuYmFzaHZhcnMKYGBgCgojIExvYWQgW1Nob3J0U3RhY2tdKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2spIGNvbmRhIGVudmlyb25tZW50CgpJZiB0aGlzIGlzIHN1Y2Nlc3NmdWwsIHRoZSBmaXJzdCBsaW5lIG9mIG91dHB1dCBzaG91bGQgc2hvdyB0aGF0IHRoZSBQeXRob24gYmVpbmcgdXNlZCBpcyB0aGUgb25lIGluIHlvdXIgW1Nob3J0U3RhY2tdKDxodHRwczovL2dpdGh1Yi5jb20vTWlrZUF4dGVsbC9TaG9ydFN0YWNrPiBjb25kYSBlbnZpcm9ubWVudCBwYXRoLgoKRS5nLgoKYHB5dGhvbjogICAgICAgICAvaG9tZS9zYW0vcHJvZ3JhbXMvbWFtYmFmb3JnZS9lbnZzL21pcm1hY2hpbmVfZW52L2Jpbi9weXRob25gCgpgYGB7ciBsb2FkLXNob3J0c3RhY2stY29uZGEtZW52LCBldmFsPVRSVUV9CnVzZV9jb25kYWVudihjb25kYWVudiA9IHNob3J0c3RhY2tfY29uZGFfZW52X25hbWUsIGNvbmRhID0gc2hvcnRzdGFja19jb25kX3BhdGgpCgojIENoZWNrIHN1Y2Nlc3NmdWwgZW52IGxvYWRpbmcKcHlfY29uZmlnKCkKYGBgCgojIERvd25sb2FkIFttaVJCYXNlXShodHRwczovL21pcmJhc2Uub3JnLykgbWF0dXJlIG1pUk5BIEZhc3RBCgpgYGB7ciBkb3dubG9hZC1taXJiYXNlLW1hdHVyZS1mYXN0YSwgZW5naW5lPSdiYXNoJywgZXZhbD1UUlVFfQojIExvYWQgYmFzaCB2YXJpYWJsZXMgaW50byBtZW1vcnkKc291cmNlIC5iYXNodmFycwoKd2dldCBcCi0tZGlyZWN0b3J5LXByZWZpeCAke2RlZXBfZGl2ZV9kYXRhX2Rpcn0gXAotLXJlY3Vyc2l2ZSBcCi0tbm8tY2hlY2stY2VydGlmaWNhdGUgXAotLWNvbnRpbnVlIFwKLS1uby1ob3N0LWRpcmVjdG9yaWVzIFwKLS1uby1kaXJlY3RvcmllcyBcCi0tbm8tcGFyZW50IFwKLS1xdWlldCBcCi0tZXhlY3V0ZSByb2JvdHM9b2ZmIFwKICR7bWlyYmFzZV9mYXN0YV91cmx9LyR7bWlyYmFzZV9tYXR1cmVfZmFzdGF9CgojIFJlbmFtZSB0byBpbmRpY2F0ZSBtaVJCYXNlIEZhc3RBIHZlcnNpb24KbXYgJHtkZWVwX2RpdmVfZGF0YV9kaXJ9LyR7bWlyYmFzZV9tYXR1cmVfZmFzdGF9ICR7ZGVlcF9kaXZlX2RhdGFfZGlyfS8ke21pcmJhc2VfbWF0dXJlX2Zhc3RhX3ZlcnNpb259CgpscyAtbGggIiR7ZGVlcF9kaXZlX2RhdGFfZGlyfSIKYGBgCgojIFJ1biBTaG9ydFN0YWNrCgojIyBFeGNlY3V0ZSBTaG9ydFN0YWNrIGNvbW1hbmQKClVzZXMgdGhlIGAtLWRuX21pcm5hYCBvcHRpb24gdG8gaWRlbnRpZnkgbWlSTkFzIGluIHRoZSBnZW5vbWUsIHdpdGhvdXQgcmVseWluZyBvbiB0aGUgYC0ta25vd25fbWlSTkFzYC4KClRoaXMgcGFydCBvZiB0aGUgY29kZSByZWRpcmVjdHMgdGhlIG91dHB1dCBvZiBgdGltZWAgdG8gdGhlIGVuZCBvZiBgc2hvcnRzdGFjay5sb2dgIGZpbGUuCgotICAgYDsgfSBcIDI+PiAke291dHB1dF9kaXJfdG9wfS9zaG9ydHN0YWNrLmxvZ2AKCmBgYHtyIHNob3J0c3RhY2ssIGVuZ2luZT0nYmFzaCcsIGNhY2hlPVRSVUV9CiMgTG9hZCBiYXNoIHZhcmlhYmxlcyBpbnRvIG1lbW9yeQpzb3VyY2UgLmJhc2h2YXJzCgojIENyZWF0ZSBhcnJheSBvZiB0cmltbWVkIEZhc3RRcwp0cmltbWVkX2Zhc3Rxc19hcnJheT0oJHt0cmltbWVkX2Zhc3Rxc19kaXJ9LyR7dHJpbW1lZF9mYXN0cXNfcGF0dGVybn0pCgoKIyBQYXNzIGFycmF5IGNvbnRlbnRzIHRvIG5ldyB2YXJpYWJsZSBhcyBzcGFjZS1kZWxpbWl0ZWQgbGlzdAp0cmltbWVkX2Zhc3Rxc19saXN0PSQoZWNobyAiJHt0cmltbWVkX2Zhc3Rxc19hcnJheVsqXX0iKQoKCiMjIyMjIyBSdW4gU2hvcnRTdGFjayAjIyMjIyMKeyB0aW1lIFwKU2hvcnRTdGFjayBcCi0tZ2Vub21lZmlsZSAiJHtnZW5vbWVfZmFzdGF9IiBcCi0tcmVhZGZpbGUgJHt0cmltbWVkX2Zhc3Rxc19saXN0fSBcCi0ta25vd25fbWlSTkFzICR7ZGVlcF9kaXZlX2RhdGFfZGlyfS8ke21pcmJhc2VfbWF0dXJlX2Zhc3RhX3ZlcnNpb259IFwKLS1kbl9taXJuYSBcCi0tdGhyZWFkcyAke3RocmVhZHN9IFwKLS1vdXRkaXIgJHtvdXRwdXRfZGlyX3RvcH0vU2hvcnRTdGFja19vdXQgXAomPiAke291dHB1dF9kaXJfdG9wfS9zaG9ydHN0YWNrLmxvZyA7IH0gXAoyPj4gJHtvdXRwdXRfZGlyX3RvcH0vc2hvcnRzdGFjay5sb2cKCmBgYAoKIyMgQ2hlY2sgcnVudGltZQoKYGBge3IgZW5naW5lPSdiYXNoJywgZXZhbD1UUlVFfQojIExvYWQgYmFzaCB2YXJpYWJsZXMgaW50byBtZW1vcnkKc291cmNlIC5iYXNodmFycwoKdGFpbCAtbiAzICR7b3V0cHV0X2Rpcl90b3B9L3Nob3J0c3RhY2subG9nIFwKfCBncmVwICJyZWFsIiBcCnwgYXdrICd7cHJpbnQgIlNob3J0U3RhY2sgcnVudGltZToiICJcdCIgJDJ9JwoKYGBgCgojIFJlc3VsdHMKCiMjIFNob3J0U3RhY2sgc3lub3BzaXMKCmBgYHtyIHNob3J0c3RhY2stc3lub3BzaXMsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KIyBMb2FkIGJhc2ggdmFyaWFibGVzIGludG8gbWVtb3J5CnNvdXJjZSAuYmFzaHZhcnMKCnRhaWwgLW4gMjAgJHtvdXRwdXRfZGlyX3RvcH0vc2hvcnRzdGFjay5sb2cKYGBgCgpTaG9ydFN0YWNrIGRpZG4ndCBpZGVudGlmeSAqYW55KiBtaVJOQXMuCgojIyBJbnNwZWN0IGBSZXN1bHRzLnR4dGAKCmBgYHtyIHJlc3VsdHMtdHh0LWZpbGUsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KIyBMb2FkIGJhc2ggdmFyaWFibGVzIGludG8gbWVtb3J5CnNvdXJjZSAuYmFzaHZhcnMKCmhlYWQgJHtvdXRwdXRfZGlyX3RvcH0vU2hvcnRTdGFja19vdXQvUmVzdWx0cy50eHQKCmVjaG8gIiIKZWNobyAiLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLSIKZWNobyAiIgoKZWNobyAiTnVtbWJlciBvZiBwb3RlbnRpYWwgbG9jaToiCmF3ayAnKE5SPjEpJyAke291dHB1dF9kaXJfdG9wfS9TaG9ydFN0YWNrX291dC9SZXN1bHRzLnR4dCB8IHdjIC1sCmBgYAoKQ29sdW1uIDIwIG9mIHRoZSBgUmVzdWx0cy50eHRgIGZpbGUgaWRlbnRpZmllcyBpZiBhIGNsdXN0ZXIgaXMgYSBtaVJOQSBvciBub3QgKGBZYCBvciBgTmApLgoKYGBge3IgcmVzdWx0cy10eHQtbWlSTkFzLCBlbmdpbmU9J2Jhc2gnLCBldmFsPVRSVUV9CiMgTG9hZCBiYXNoIHZhcmlhYmxlcyBpbnRvIG1lbW9yeQpzb3VyY2UgLmJhc2h2YXJzCgplY2hvICJOdW1iZXIgb2YgbG9jaSBjaGFyYWN0ZXJpemVkIGFzIG1pUk5BOiIKYXdrICckMjA9PSJZIiB7cHJpbnQgJDB9JyAke291dHB1dF9kaXJfdG9wfS9TaG9ydFN0YWNrX291dC9SZXN1bHRzLnR4dCBcCnwgd2MgLWwKZWNobyAiIgoKZWNobyAiLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLSIKCmVjaG8gIiIKZWNobyAiTnVtYmVyIG9mIGxvY2kgX25vdF8gY2hhcmFjdGVyaXplZCBhcyBtaVJOQToiCmF3ayAnJDIwPT0iTiIge3ByaW50ICQwfScgJHtvdXRwdXRfZGlyX3RvcH0vU2hvcnRTdGFja19vdXQvUmVzdWx0cy50eHQgXAp8IHdjIC1sCgpgYGAKCkNvbHVtbiAyMSBvZiB0aGUgYFJlc3VsdHMudHh0YCBmaWxlIGlkZW50aWZpZXMgaWYgYSBjbHVzdGVyIGFsaWduZWQgdG8gYSBrbm93biBtaVJOQSAobWlSQmFzZSkgb3Igbm90IChgWWAgb3IgYE5BYCkuCgpTaW5jZSB0aGVyZSBhcmUgbm8gbWlSTkFzLCB0aGUgZm9sbG93aW5nIGNvZGUgd2lsbCAqbm90KiBwcmludCBhbnkgb3V0cHV0LgoKVGhlIGBlY2hvYCBjb21tYW5kIGFmdGVyIHRoZSBgYXdrYCBjb21tYW5kIGlzIHNpbXBseSB0aGVyZSB0byBwcm92ZSB0aGF0IHRoZSBjaHVuayBleGVjdXRlZC4KCmBgYHtyIHJlc3VsdHMtdHh0LW1pUkJhc2UtbWlSTkFzLCBlbmdpbmU9J2Jhc2gnLCBldmFsPVRSVUV9CiMgTG9hZCBiYXNoIHZhcmlhYmxlcyBpbnRvIG1lbW9yeQpzb3VyY2UgLmJhc2h2YXJzCgplY2hvICJOdW1iZXIgb2YgbG9jaSBtYXRjaGluZyBtaVJCYXNlIG1pUk5BczoiCmF3ayAnJDIxIT0iTkEiIHtwcmludCAkMH0nICR7b3V0cHV0X2Rpcl90b3B9L1Nob3J0U3RhY2tfb3V0L1Jlc3VsdHMudHh0IFwKfCB3YyAtbAplY2hvICIiCgplY2hvICItLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tIgoKZWNobyAiIgplY2hvICJOdW1iZXIgb2YgbG9jaSBfbm90XyBtYXRjaGluZyBtaVJCYXNlIG1pUk5BczoiCmF3ayAnJDIxPT0iTkEiIHtwcmludCAkMH0nICR7b3V0cHV0X2Rpcl90b3B9L1Nob3J0U3RhY2tfb3V0L1Jlc3VsdHMudHh0IFwKfCB3YyAtbAoKYGBgCgpBbHRob3VnaCB0aGVyZSBhcmUgbG9jaSB3aXRoIG1hdGNoZXMgdG8gbWlSQmFzZSBtaVJOQXMsIFNob3J0U3RhY2sgZGlkICpub3QqIGFubm90YXRlIHRoZXNlIGNsdXN0ZXJzIGFzIG1pUk5BcyBsaWtlbHkgW2JlY2F1c2UgdGhleSBkbyBub3QgKmFsc28qIG1hdGNoIHNlY29uZGFyeSBzdHJ1Y3R1cmUgY3JpdGVyaWFdKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2sjbWlybmEtYW5ub3RhdGlvbikuCgojIyMgRGlyZWN0b3J5IHRyZWUgb2YgYWxsIFNob3J0U3RhY2sgb3V0cHV0cwoKTWFueSBvZiB0aGVzZSBhcmUgbGFyZ2UgKGJ5IEdpdEh1YiBzdGFuZGFyZHMpIEJBTSBmaWxlcywgc28gd2lsbCBub3QgYmUgYWRkZWQgdG8gdGhlIHJlcG8uCgpBZGRpdGlvbmFsbHksIGl0J3MgdW5saWtlbHkgd2UnbGwgdXRpbGl6ZSBtb3N0IG9mIHRoZSBvdGhlciBmaWxlcyAoYmlnd2lnKSBnZW5lcmF0ZWQgYnkgU2hvcnRTdGFjay4KCmBgYHtyIHNob3J0c3RhY2stZGlyZWN0b3J5LXRyZWUsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KIyBMb2FkIGJhc2ggdmFyaWFibGVzIGludG8gbWVtb3J5CnNvdXJjZSAuYmFzaHZhcnMKCnRyZWUgLWggJHtvdXRwdXRfZGlyX3RvcH0vCgpgYGAKCi0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKIyBDaXRhdGlvbnMK

08-Peve-sRNAseq-ShortStack

Sam White

2023-11-15

1 Set R variables

2 Create a Bash variables file

3 Load ShortStack conda environment

4 Download miRBase mature miRNA FastA

5 Run ShortStack

5.1 Excecute ShortStack command

5.2 Check runtime

6 Results

6.1 ShortStack synopsis

6.2 Inspect `Results.txt`

6.2.1 Directory tree of all ShortStack outputs

Citations

08-Peve-sRNAseq-ShortStack

Sam White

2023-11-15

1 Set R variables

2 Create a Bash variables file

3 Load ShortStack conda environment

4 Download miRBase mature miRNA FastA

5 Run ShortStack

5.1 Excecute ShortStack command

5.2 Check runtime

6 Results

6.1 ShortStack synopsis

6.2 Inspect Results.txt

6.2.1 Directory tree of all ShortStack outputs

Citations

6.2 Inspect `Results.txt`