Use ShortStack (Axtell 2013; Shahid and Axtell 2014; Johnson et al. 2016)to perform alignment of sRNAseq data and annotation of sRNA-producing genes.

This is the same ShortStack analysis as seen in 13.1-Pmea-sRNAseq-ShortStack-R1-reads.Rmd, but this analysis uses a customized miRBase database, created by Jill Ashley, which includes published cnidarian miRNAs:

cnidarian_miRNAs.fasta

The P.meandrina genome will be used as the reference genome.

Inputs:

Requires trimmed sRNAseq files generated by 08.1-Pmea-sRNAseq-trimming-R1-only.Rmd
- Filenames formatted: *fastp-adapters-polyG-31bp-merged.fq.gz
P.meandrina genome FastA. See 12-Pmea-sRNAseq-MirMachine.Rmd for download info if needed.

Outputs:

See ShortStack outputs documentation for full list and detailed descriptions.

Software requirements:

Utilizes a ShortStack Conda/Mamba environment, per the installation instructions.

Replace with name of your ShortStack environment and the path to the corresponding conda installation (find this after you’ve activated the environment).

E.g.

# Activate environment
conda activate ShortStack4_env

# Find conda path
which conda

1 Set R variables

shortstack_conda_env_name <- c("ShortStack-4.0.3_env")
shortstack_cond_path <- c("/home/sam/programs/mambaforge/condabin/conda")

2 Create a Bash variables file

This allows usage of Bash variables across R Markdown chunks.

{
echo "#### Assign Variables ####"
echo ""

echo "# Trimmed FastQ naming pattern"
echo "export trimmed_fastqs_pattern='*fastp-adapters-polyG-31bp-merged.fq.gz'"

echo "# Data directories"
echo 'export deep_dive_dir=/home/shared/8TB_HDD_01/sam/gitrepos/deep-dive'
echo 'export deep_dive_data_dir="${deep_dive_dir}/data"'
echo 'export output_dir_top=${deep_dive_dir}/F-Pmea/output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase'
echo 'export trimmed_fastqs_dir="${deep_dive_dir}/F-Pmea/output/08.2-Pmea-sRNAseq-trimming-31bp-fastp-merged/trimmed-reads"'
echo ""

echo "# Input/Output files"
echo 'export genome_fasta_dir=${deep_dive_dir}/F-Pmea/data'
echo 'export genome_fasta_name="Pocillopora_meandrina_HIv1.assembly.fasta"'
echo 'export shortstack_genome_fasta_name="Pocillopora_meandrina_HIv1.assembly.fa"'

echo 'export mirbase_mature_fasta_version=cnidarian-mirbase-mature-v22.1.fasta'
echo 'export genome_fasta="${genome_fasta_dir}/${shortstack_genome_fasta_name}"'
echo ""


echo "# Set number of CPUs to use"
echo 'export threads=46'
echo ""

echo "# Initialize arrays"
echo 'export trimmed_fastqs_array=()'


} > .bashvars

cat .bashvars

#### Assign Variables ####

# Trimmed FastQ naming pattern
export trimmed_fastqs_pattern='*fastp-adapters-polyG-31bp-merged.fq.gz'
# Data directories
export deep_dive_dir=/home/shared/8TB_HDD_01/sam/gitrepos/deep-dive
export deep_dive_data_dir="${deep_dive_dir}/data"
export output_dir_top=${deep_dive_dir}/F-Pmea/output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase
export trimmed_fastqs_dir="${deep_dive_dir}/F-Pmea/output/08.2-Pmea-sRNAseq-trimming-31bp-fastp-merged/trimmed-reads"

# Input/Output files
export genome_fasta_dir=${deep_dive_dir}/F-Pmea/data
export genome_fasta_name="Pocillopora_meandrina_HIv1.assembly.fasta"
export shortstack_genome_fasta_name="Pocillopora_meandrina_HIv1.assembly.fa"
export mirbase_mature_fasta_version=cnidarian-mirbase-mature-v22.1.fasta
export genome_fasta="${genome_fasta_dir}/${shortstack_genome_fasta_name}"

# Set number of CPUs to use
export threads=46

# Initialize arrays
export trimmed_fastqs_array=()

3 Load ShortStack conda environment

If this is successful, the first line of output should show that the Python being used is the one in your [ShortStack](https://github.com/MikeAxtell/ShortStack conda environment path.

E.g.

python: /home/sam/programs/mambaforge/envs/mirmachine_env/bin/python

use_condaenv(condaenv = shortstack_conda_env_name, conda = shortstack_cond_path)

# Check successful env loading
py_config()

python:         /home/sam/programs/mambaforge/envs/ShortStack-4.0.3_env/bin/python
libpython:      /home/sam/programs/mambaforge/envs/ShortStack-4.0.3_env/lib/libpython3.10.so
pythonhome:     /home/sam/programs/mambaforge/envs/ShortStack-4.0.3_env:/home/sam/programs/mambaforge/envs/ShortStack-4.0.3_env
version:        3.10.13 | packaged by conda-forge | (main, Dec 23 2023, 15:36:39) [GCC 12.3.0]
numpy:          /home/sam/programs/mambaforge/envs/ShortStack-4.0.3_env/lib/python3.10/site-packages/numpy
numpy_version:  1.26.4

NOTE: Python version was forced by use_python() function

4 Run ShortStack

4.1 Modify genome filename for ShortStack compatability

# Load bash variables into memory
source .bashvars

# Check for FastA file first
# Then create rename file if doesn't exist
if [ -f "${genome_fasta_dir}/${shortstack_genome_fasta_name}" ]; then
  echo "${genome_fasta_dir}/${shortstack_genome_fasta_name} already exists. Nothing to do."
  echo ""
else

  # Copy genome FastA to ShortStack-compatible filename (ending with .fa)
  cp ${genome_fasta_dir}/${genome_fasta_name} ${genome_fasta_dir}/${shortstack_genome_fasta_name}
fi

# Confirm
ls -lh ${genome_fasta_dir}/${shortstack_genome_fasta_name}

/home/shared/8TB_HDD_01/sam/gitrepos/deep-dive/F-Pmea/data/Pocillopora_meandrina_HIv1.assembly.fa already exists. Nothing to do.

-rw-r--r-- 1 sam sam 360M Feb 16 10:28 /home/shared/8TB_HDD_01/sam/gitrepos/deep-dive/F-Pmea/data/Pocillopora_meandrina_HIv1.assembly.fa

4.2 Excecute ShortStack command

Uses the --dn_mirna option to identify miRNAs in the genome, without relying on the --known_miRNAs.

This part of the code redirects the output of time to the end of shortstack.log file.

; } \ 2>> ${output_dir_top}/shortstack.log

# Load bash variables into memory
source .bashvars

# Make output directory, if it doesn't exist
mkdir --parents "${output_dir_top}"

# Create array of trimmed FastQs
trimmed_fastqs_array=(${trimmed_fastqs_dir}/${trimmed_fastqs_pattern})


# Pass array contents to new variable as space-delimited list
trimmed_fastqs_list=$(echo "${trimmed_fastqs_array[*]}")


###### Run ShortStack ######
{ time \
ShortStack \
--genomefile "${genome_fasta}" \
--readfile ${trimmed_fastqs_list} \
--known_miRNAs ${deep_dive_data_dir}/${mirbase_mature_fasta_version} \
--dn_mirna \
--threads ${threads} \
--outdir ${output_dir_top}/ShortStack_out \
&> ${output_dir_top}/shortstack.log ; } \
2>> ${output_dir_top}/shortstack.log

4.3 Check runtime

# Load bash variables into memory
source .bashvars

tail -n 3 ${output_dir_top}/shortstack.log \
| grep "real" \
| awk '{print "ShortStack runtime:" "\t" $2}'

ShortStack runtime: 39m54.805s

5 Results

5.1 ShortStack synopsis

# Load bash variables into memory
source .bashvars

tail -n 25 ${output_dir_top}/shortstack.log

Writing final files

Found a total of 37 MIRNA loci


Non-MIRNA loci by DicerCall:
N 7087
22 33
23 33
24 15
21 15

Creating visualizations of microRNA loci with strucVis
<<< WARNING >>>
Do not rely on these results alone to annotate new MIRNA loci!
The false positive rate for de novo MIRNA identification is low, but NOT ZERO
Insepct each mirna locus, especially the strucVis output, and see
https://doi.org/10.1105/tpc.17.00851 , https://doi.org/10.1093/nar/gky1141

Thu 06 Jun 2024 08:55:50 -0700 PDT
Run Completed!

real    39m54.805s
user    726m24.259s
sys 252m56.657s

ShortStack identified 37 miRNAs.

5.2 Inspect `Results.txt`

# Load bash variables into memory
source .bashvars

head ${output_dir_top}/ShortStack_out/Results.txt

echo ""
echo "----------------------------------------------------------"
echo ""

echo "Nummber of potential loci:"
awk '(NR>1)' ${output_dir_top}/ShortStack_out/Results.txt | wc -l

Locus   Name    Chrom   Start   End Length  Reads   DistinctSequences   FracTop Strand  MajorRNA    MajorRNAReads   Short   Long    21  22  23  24  DicerCall   MIRNA   known_miRNAs
Pocillopora_meandrina_HIv1___Sc0000000:9092-9521    Cluster_1   Pocillopora_meandrina_HIv1___Sc0000000  9092    9521    430 10813   348 0.9999075187274576  +   GGGGGUAUAGCUCAGUGGUAGA  3850    1422    3739    637 4394    174 447 N   N   NA
Pocillopora_meandrina_HIv1___Sc0000000:53578-53997  Cluster_2   Pocillopora_meandrina_HIv1___Sc0000000  53578   53997   420 287 13  0.9965156794425087  +   GCCUAAGUUGCUUGGAACA 138 285 2   0   0   0   0   N   N   NA
Pocillopora_meandrina_HIv1___Sc0000000:150243-150718    Cluster_3   Pocillopora_meandrina_HIv1___Sc0000000  150243  150718  476 2549    247 0.0 -   UGGCUAUGAUGAAAAUGACU    335 849 380 634 376 139 171 N   N   NA
Pocillopora_meandrina_HIv1___Sc0000000:173728-174150    Cluster_4   Pocillopora_meandrina_HIv1___Sc0000000  173728  174150  423 1257    65  0.9968178202068417  +   UUUGAUUGCUGUGAUCUGGUUG  432 106 2   39  636 444 30  22  N   apa-mir-2050_Exaiptasia_pallida_Baumgarten_et_al._2017_miR-2050;_Nve;_Spis;_Adi
Pocillopora_meandrina_HIv1___Sc0000000:187562-188076    Cluster_5   Pocillopora_meandrina_HIv1___Sc0000000  187562  188076  515 185 37  0.43243243243243246 .   AUAAAUGUCACUACAAGAAACCUGAAAUCGU 25  2   175 1   1   2   4   N   N   NA
Pocillopora_meandrina_HIv1___Sc0000000:485730-486254    Cluster_6   Pocillopora_meandrina_HIv1___Sc0000000  485730  486254  525 286 127 1.0 +   GAUGGGUGUUAUUACUCCUCAGACAGAC    48  66  183 7   11  3   16  N   N   NA
Pocillopora_meandrina_HIv1___Sc0000000:496020-496432    Cluster_7   Pocillopora_meandrina_HIv1___Sc0000000  496020  496432  413 72  24  1.0 +   AUGUAGUCGAGCAAAGUCCAUGUGGACGA   27  0   66  2   1   1   2   N   N   NA
Pocillopora_meandrina_HIv1___Sc0000000:525310-527341    Cluster_8   Pocillopora_meandrina_HIv1___Sc0000000  525310  527341  2032    14765   2997    0.1810362343379614  -   UUUUCGUCACUUUCUUCAGCCUCAGAGU    966 140 13674   47  106 311 487 N   N   NA
Pocillopora_meandrina_HIv1___Sc0000000:541262-541723    Cluster_9   Pocillopora_meandrina_HIv1___Sc0000000  541262  541723  462 732 134 0.07923497267759563 -   UUGGACGAAAUUUCGAGGUUCACACUCGUU  91  1   725 1   4   1   0   N   N   NA

----------------------------------------------------------

Nummber of potential loci:
7220

Column 20 of the Results.txt file identifies if a cluster is a miRNA or not (Y or N).

# Load bash variables into memory
source .bashvars

echo "Number of loci characterized as miRNA:"
awk '$20=="Y" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l
echo ""

echo "----------------------------------------------------------"

echo ""
echo "Number of loci _not_ characterized as miRNA:"
awk '$20=="N" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l

Number of loci characterized as miRNA:
37

----------------------------------------------------------

Number of loci _not_ characterized as miRNA:
7183

Column 21 of the Results.txt file identifies if a cluster aligned to a known miRNA (miRBase) or not (Y or NA).

The echo command after the awk command is simply there to prove that the chunk executed.

# Load bash variables into memory
source .bashvars

echo "Number of loci matching miRBase miRNAs:"
awk '$21!="NA" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l
echo ""

echo "----------------------------------------------------------"

echo ""
echo "Number of loci _not_ matching miRBase miRNAs:"
awk '$21=="NA" {print $0}' ${output_dir_top}/ShortStack_out/Results.txt \
| wc -l

Number of loci matching miRBase miRNAs:
96

----------------------------------------------------------

Number of loci _not_ matching miRBase miRNAs:
7125

Although there are loci with matches to miRBase miRNAs, ShortStack did not annotate these clusters as miRNAs likely because they do not also match secondary structure criteria.

5.2.1 Directory tree of all ShortStack outputs

Many of these are large (by GitHub standards) BAM files, so will not be added to the repo.

Additionally, it’s unlikely we’ll utilize most of the other files (bigwig) generated by ShortStack.

# Load bash variables into memory
source .bashvars

tree -h ${output_dir_top}/

/home/shared/8TB_HDD_01/sam/gitrepos/deep-dive/F-Pmea/output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase/
├── [4.0K]  figures
│   ├── [130K]  Pmea_ShortStack_dbmatch_histogram.png
│   ├── [202K]  Pmea_ShortStack_miRNA_histogram.png
│   ├── [192K]  Pmea_ShortStack_miRNA_histogram_reduced.png
│   └── [200K]  Pmea_ShortStack_venn.png
├── [ 22K]  shortstack.log
└── [ 16K]  ShortStack_out
    ├── [ 31K]  alignment_details.tsv
    ├── [606K]  Counts.txt
    ├── [179K]  known_miRNAs.gff3
    ├── [1.8M]  known_miRNAs_unaligned.fasta
    ├── [6.9M]  merged_alignments_21_m.bw
    ├── [7.1M]  merged_alignments_21_p.bw
    ├── [6.7M]  merged_alignments_22_m.bw
    ├── [6.8M]  merged_alignments_22_p.bw
    ├── [ 13M]  merged_alignments_23-24_m.bw
    ├── [ 13M]  merged_alignments_23-24_p.bw
    ├── [1.0G]  merged_alignments.bam
    ├── [153K]  merged_alignments.bam.csi
    ├── [ 45M]  merged_alignments_other_m.bw
    ├── [ 45M]  merged_alignments_other_p.bw
    ├── [ 23M]  merged_alignments_sRNA-POC-47-S1-TP2-fastp-adapters-polyG-31bp-merged.bw
    ├── [ 30M]  merged_alignments_sRNA-POC-48-S1-TP2-fastp-adapters-polyG-31bp-merged.bw
    ├── [ 24M]  merged_alignments_sRNA-POC-50-S1-TP2-fastp-adapters-polyG-31bp-merged.bw
    ├── [ 38M]  merged_alignments_sRNA-POC-53-S1-TP2-fastp-adapters-polyG-31bp-merged.bw
    ├── [ 49M]  merged_alignments_sRNA-POC-57-S1-TP2-fastp-adapters-polyG-31bp-merged.bw
    ├── [ 13K]  mir.fasta
    ├── [919K]  Results.gff3
    ├── [1.4M]  Results.txt
    ├── [179M]  sRNA-POC-47-S1-TP2-fastp-adapters-polyG-31bp-merged.bam
    ├── [169K]  sRNA-POC-47-S1-TP2-fastp-adapters-polyG-31bp-merged.bam.csi
    ├── [191M]  sRNA-POC-48-S1-TP2-fastp-adapters-polyG-31bp-merged.bam
    ├── [169K]  sRNA-POC-48-S1-TP2-fastp-adapters-polyG-31bp-merged.bam.csi
    ├── [174M]  sRNA-POC-50-S1-TP2-fastp-adapters-polyG-31bp-merged.bam
    ├── [169K]  sRNA-POC-50-S1-TP2-fastp-adapters-polyG-31bp-merged.bam.csi
    ├── [231M]  sRNA-POC-53-S1-TP2-fastp-adapters-polyG-31bp-merged.bam
    ├── [168K]  sRNA-POC-53-S1-TP2-fastp-adapters-polyG-31bp-merged.bam.csi
    ├── [209M]  sRNA-POC-57-S1-TP2-fastp-adapters-polyG-31bp-merged.bam
    ├── [160K]  sRNA-POC-57-S1-TP2-fastp-adapters-polyG-31bp-merged.bam.csi
    └── [4.0K]  strucVis
        ├── [ 12K]  Cluster_1002.ps
        ├── [ 35K]  Cluster_1002.txt
        ├── [ 11K]  Cluster_1056.ps
        ├── [3.6K]  Cluster_1056.txt
        ├── [ 11K]  Cluster_1069.ps
        ├── [ 10K]  Cluster_1069.txt
        ├── [ 11K]  Cluster_1108.ps
        ├── [7.4K]  Cluster_1108.txt
        ├── [ 12K]  Cluster_1274.ps
        ├── [ 25K]  Cluster_1274.txt
        ├── [ 13K]  Cluster_1279.ps
        ├── [ 64K]  Cluster_1279.txt
        ├── [ 13K]  Cluster_1783.ps
        ├── [ 41K]  Cluster_1783.txt
        ├── [ 12K]  Cluster_1922.ps
        ├── [ 35K]  Cluster_1922.txt
        ├── [ 12K]  Cluster_1940.ps
        ├── [ 39K]  Cluster_1940.txt
        ├── [ 12K]  Cluster_1941.ps
        ├── [ 30K]  Cluster_1941.txt
        ├── [ 12K]  Cluster_19.ps
        ├── [ 30K]  Cluster_19.txt
        ├── [ 12K]  Cluster_2786.ps
        ├── [8.3K]  Cluster_2786.txt
        ├── [ 12K]  Cluster_2830.ps
        ├── [5.2K]  Cluster_2830.txt
        ├── [ 11K]  Cluster_2832.ps
        ├── [7.4K]  Cluster_2832.txt
        ├── [ 11K]  Cluster_2852.ps
        ├── [ 14K]  Cluster_2852.txt
        ├── [ 11K]  Cluster_2970.ps
        ├── [5.6K]  Cluster_2970.txt
        ├── [ 11K]  Cluster_3397.ps
        ├── [ 31K]  Cluster_3397.txt
        ├── [ 11K]  Cluster_34.ps
        ├── [3.7K]  Cluster_34.txt
        ├── [ 12K]  Cluster_356.ps
        ├── [ 41K]  Cluster_356.txt
        ├── [ 11K]  Cluster_3670.ps
        ├── [ 14K]  Cluster_3670.txt
        ├── [ 12K]  Cluster_4059.ps
        ├── [7.7K]  Cluster_4059.txt
        ├── [ 12K]  Cluster_4060.ps
        ├── [5.1K]  Cluster_4060.txt
        ├── [ 12K]  Cluster_4142.ps
        ├── [ 14K]  Cluster_4142.txt
        ├── [ 12K]  Cluster_4466.ps
        ├── [ 35K]  Cluster_4466.txt
        ├── [ 12K]  Cluster_4468.ps
        ├── [ 53K]  Cluster_4468.txt
        ├── [ 12K]  Cluster_4469.ps
        ├── [ 24K]  Cluster_4469.txt
        ├── [ 12K]  Cluster_4470.ps
        ├── [ 30K]  Cluster_4470.txt
        ├── [ 12K]  Cluster_4471.ps
        ├── [8.4K]  Cluster_4471.txt
        ├── [ 12K]  Cluster_4599.ps
        ├── [ 64K]  Cluster_4599.txt
        ├── [ 12K]  Cluster_4778.ps
        ├── [7.0K]  Cluster_4778.txt
        ├── [ 12K]  Cluster_4846.ps
        ├── [ 31K]  Cluster_4846.txt
        ├── [ 11K]  Cluster_5275.ps
        ├── [4.5K]  Cluster_5275.txt
        ├── [ 12K]  Cluster_5642.ps
        ├── [ 16K]  Cluster_5642.txt
        ├── [ 12K]  Cluster_5770.ps
        ├── [ 17K]  Cluster_5770.txt
        ├── [ 12K]  Cluster_6429.ps
        ├── [ 21K]  Cluster_6429.txt
        ├── [ 12K]  Cluster_751.ps
        ├── [ 27K]  Cluster_751.txt
        ├── [ 12K]  Cluster_912.ps
        └── [ 30K]  Cluster_912.txt

3 directories, 111 files

5.3 Visualize

We noticed that a) not all of the identified miRNAs have database matches, and b) some reads have a match in the database but are not classified as miRNAs. Let’s look at this in more depth.

Pmea_shortstack_results <- read.csv("../output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase/ShortStack_out/Results.txt", sep="\t")

# Reads identified as miRNAs (but not necessarily known)
Pmea_shortstack_results %>% 
  filter(MIRNA == "Y") %>%
  mutate(known_miRNAs = str_sub(known_miRNAs, 1, 40)) %>%
  mutate(Locus = str_sub(Locus, 20, 40)) %>%
  ggplot(aes(x = reorder(Locus, Reads), y = Reads, fill = known_miRNAs)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Reads), vjust = -0.5, position = position_dodge(width = -0.5), color = "black", size = 2.5, angle = 90) +
  labs(x = "miRNA", y = "Read count", 
       title = "Reads identified by ShortStack as miRNAs",
       fill = "Annotation") +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank())

ggsave("../output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase/figures/Pmea_ShortStack_miRNA_histogram.png", width = 12, height = 7, units = "in")


# Reads matched in the reference db (but not necessarily identified as miRNA)
Pmea_shortstack_results %>% 
  filter(!is.na(known_miRNAs)) %>%
  mutate(known_miRNAs = str_sub(known_miRNAs, 1, 40)) %>%
  mutate(Locus = str_sub(Locus, 20, 40)) %>%
  ggplot(aes(x = reorder(Locus, Reads), y = Reads, fill = MIRNA)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Reads), vjust = 0.5, position = position_dodge(width = -0.5), color = "black", size = 2.5, angle = 90) +
  labs(x = "miRNA", y = "Read count", 
       title = "Reads with miRBase+cnidarian database matches",
       fill = "Identified as miRNA?") +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank())

ggsave("../output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase/figures/Pmea_ShortStack_dbmatch_histogram.png", width = 12, height = 7, units = "in")

There’s one miRNA with a very high read count, and it’s making visualization of the rest difficult. Let’s remove it and retry visualizing the rest.

# Reads identified as miRNAs (but not necessarily known)
Pmea_shortstack_results %>% 
  filter(MIRNA == "Y") %>%
  filter(Reads < 200000) %>%
  mutate(known_miRNAs = str_sub(known_miRNAs, 1, 40)) %>%
  mutate(Locus = str_sub(Locus, 20, 40)) %>%
  ggplot(aes(x = reorder(Locus, Reads), y = Reads, fill = known_miRNAs)) +
  geom_bar(stat = "identity", position = "dodge") +
   geom_text(aes(label = Reads), vjust = 0.5, hjust = 0, color = "black", size = 2.5, angle = 90) +
  labs(x = "miRNA", y = "Read count", 
       title = "Reads identified by ShortStack as miRNAs",
       fill = "Annotation") +
  theme(axis.text.x = element_blank(),
        axis.ticks.x = element_blank())

ggsave("../output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase/figures/Pmea_ShortStack_miRNA_histogram_reduced.png", width = 12, height = 7, units = "in")

# Make list
mirnas <- Pmea_shortstack_results %>% filter(MIRNA == "Y") %>% pull(Locus)
matches <- Pmea_shortstack_results %>% filter(!is.na(known_miRNAs)) %>% pull(Locus)

Pmea_shortstack_vennlist <- list(
  "Identified as miRNA" = mirnas,
  "Database match" = matches
)

# Make venn diagrams
ggvenn(Pmea_shortstack_vennlist)

ggsave("../output/13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase/figures/Pmea_ShortStack_venn.png", width = 12, height = 7, units = "in")

Citations

Axtell, Michael J. 2013. “ShortStack: Comprehensive Annotation and Quantification of Small RNA Genes.” RNA 19 (6): 740–51. https://doi.org/10.1261/rna.035279.112.

Johnson, Nathan R, Jonathan M Yeoh, Ceyda Coruh, and Michael J Axtell. 2016. “Improved Placement of Multi-Mapping Small RNAs.” G3 Genes|Genomes|Genetics 6 (7): 2103–11. https://doi.org/10.1534/g3.116.030452.

Shahid, Saima, and Michael J. Axtell. 2014. “Identification and Annotation of Small RNA Genes Using ShortStack.” Methods 67 (1): 20–27. https://doi.org/10.1016/j.ymeth.2013.10.004.

LS0tCnRpdGxlOiAiMTMuMi4xLVBtZWEtc1JOQXNlcS1TaG9ydFN0YWNrLTMxYnAtZmFzdHAtbWVyZ2VkLWNuaWRhcmlhbl9taVJCYXNlIgphdXRob3I6ICJTYW0gV2hpdGUiCmRhdGU6ICIyMDI0LTAyLTE2IgpvdXRwdXQ6IAogIGJvb2tkb3duOjpodG1sX2RvY3VtZW50MjoKICAgIHRoZW1lOiBjb3NtbwogICAgdG9jOiB0cnVlCiAgICB0b2NfZmxvYXQ6IHRydWUKICAgIG51bWJlcl9zZWN0aW9uczogdHJ1ZQogICAgY29kZV9mb2xkaW5nOiBzaG93CiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCiAgZ2l0aHViX2RvY3VtZW50OgogICAgdG9jOiB0cnVlCiAgICBudW1iZXJfc2VjdGlvbnM6IHRydWUKICBodG1sX2RvY3VtZW50OgogICAgdGhlbWU6IGNvc21vCiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQogICAgbnVtYmVyX3NlY3Rpb25zOiB0cnVlCiAgICBjb2RlX2ZvbGRpbmc6IHNob3cKICAgIGNvZGVfZG93bmxvYWQ6IHRydWUKYmlibGlvZ3JhcGh5OiByZWZlcmVuY2VzLmJpYgpsaW5rLWNpdGF0aW9uczogdHJ1ZQotLS0KCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQpsaWJyYXJ5KGtuaXRyKQpsaWJyYXJ5KGthYmxlRXh0cmEpCmxpYnJhcnkoZHBseXIpCmxpYnJhcnkocmV0aWN1bGF0ZSkKbGlicmFyeShnZ3Bsb3QyKQpsaWJyYXJ5KHN0cmluZ3IpCmxpYnJhcnkoZ2d2ZW5uKQprbml0cjo6b3B0c19jaHVuayRzZXQoCiAgZWNobyA9IFRSVUUsICAgICAgICAgIyBEaXNwbGF5IGNvZGUgY2h1bmtzCiAgZXZhbCA9IEZBTFNFLCAgICAgICAgIyBFdmFsdWF0ZSBjb2RlIGNodW5rcwogIHdhcm5pbmcgPSBGQUxTRSwgICAgICMgSGlkZSB3YXJuaW5ncwogIG1lc3NhZ2UgPSBGQUxTRSwgICAgICMgSGlkZSBtZXNzYWdlcwogIGNvbW1lbnQgPSAiIiAgICAgICAgICMgUHJldmVudHMgYXBwZW5kaW5nICcjIycgdG8gYmVnaW5uaW5nIG9mIGxpbmVzIGluIGNvZGUgb3V0cHV0CikKYGBgCgpVc2UgW1Nob3J0U3RhY2tdKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2spIFtAYXh0ZWxsMjAxM2E7IEBzaGFoaWQyMDE0OyBAam9obnNvbjIwMTZhXXRvIHBlcmZvcm0gYWxpZ25tZW50IG9mIHNSTkFzZXEgZGF0YSBhbmQgYW5ub3RhdGlvbiBvZiBzUk5BLXByb2R1Y2luZyBnZW5lcy4KClRoaXMgaXMgdGhlIHNhbWUgU2hvcnRTdGFjayBhbmFseXNpcyBhcyBzZWVuIGluIFsxMy4xLVBtZWEtc1JOQXNlcS1TaG9ydFN0YWNrLVIxLXJlYWRzLlJtZF0oaHR0cHM6Ly9naXRodWIuY29tL3Vyb2wtZTUvZGVlcC1kaXZlL2Jsb2IvbWFpbi9ELUFwdWwvY29kZS8xMy4xLVBtZWEtc1JOQXNlcS1TaG9ydFN0YWNrLVIxLXJlYWRzLlJtZCksIGJ1dCB0aGlzIGFuYWx5c2lzIHVzZXMgYSBjdXN0b21pemVkIG1pUkJhc2UgZGF0YWJhc2UsIGNyZWF0ZWQgYnkgSmlsbCBBc2hsZXksIHdoaWNoIGluY2x1ZGVzIHB1Ymxpc2hlZCBjbmlkYXJpYW4gbWlSTkFzOgoKLSBbYGNuaWRhcmlhbl9taVJOQXMuZmFzdGFgXShodHRwczovL2dpdGh1Yi5jb20vdXJvbC1lNS9kZWVwLWRpdmUvYmxvYi9tYWluL0RFRi1jcm9zcy1zcGVjaWVzL2RhdGEvY25pZGFyaWFuX21pUk5Bcy5mYXN0YSkKClRoZSAqUC5tZWFuZHJpbmEqIGdlbm9tZSB3aWxsIGJlIHVzZWQgYXMgdGhlIHJlZmVyZW5jZSBnZW5vbWUuCgotLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KCklucHV0czoKCi0gICBSZXF1aXJlcyB0cmltbWVkIHNSTkFzZXEgZmlsZXMgZ2VuZXJhdGVkIGJ5IFswOC4xLVBtZWEtc1JOQXNlcS10cmltbWluZy1SMS1vbmx5LlJtZF0oaHR0cHM6Ly9naXRodWIuY29tL3Vyb2wtZTUvZGVlcC1kaXZlL2Jsb2IvbWFpbi9GLVBtZWEvY29kZS8wOC4xLVBtZWEtc1JOQXNlcS10cmltbWluZy1SMS1vbmx5LlJtZCkKCiAgICAtICAgRmlsZW5hbWVzIGZvcm1hdHRlZDogYCpmYXN0cC1hZGFwdGVycy1wb2x5Ry0zMWJwLW1lcmdlZC5mcS5nemAKCi0gICAqUC5tZWFuZHJpbmEqIGdlbm9tZSBGYXN0QS4gU2VlIFsxMi1QbWVhLXNSTkFzZXEtTWlyTWFjaGluZS5SbWRdKGh0dHBzOi8vZ2l0aHViLmNvbS91cm9sLWU1L2RlZXAtZGl2ZS9ibG9iL21haW4vRi1QbWVhL2NvZGUvMTItUG1lYS1zUk5Bc2VxLU1pck1hY2hpbmUuUm1kKSBmb3IgZG93bmxvYWQgaW5mbyBpZiBuZWVkZWQuCgpPdXRwdXRzOgoKLSAgIFNlZSBbU2hvcnRTdGFjayBvdXRwdXRzIGRvY3VtZW50YXRpb25dKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2sjb3V0cHV0cykgZm9yIGZ1bGwgbGlzdCBhbmQgZGV0YWlsZWQgZGVzY3JpcHRpb25zLgoKU29mdHdhcmUgcmVxdWlyZW1lbnRzOgoKLSAgIFV0aWxpemVzIGEgW1Nob3J0U3RhY2tdKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2sjaW5zdGFsbGF0aW9uKSBDb25kYS9NYW1iYSBlbnZpcm9ubWVudCwgcGVyIHRoZSBpbnN0YWxsYXRpb24gaW5zdHJ1Y3Rpb25zLgoKUmVwbGFjZSB3aXRoIG5hbWUgb2YgeW91ciBTaG9ydFN0YWNrIGVudmlyb25tZW50IGFuZCB0aGUgcGF0aCB0byB0aGUgY29ycmVzcG9uZGluZyBjb25kYSBpbnN0YWxsYXRpb24gKGZpbmQgdGhpcyAqYWZ0ZXIqIHlvdSd2ZSBhY3RpdmF0ZWQgdGhlIGVudmlyb25tZW50KS4KCkUuZy4KCmBgYCBiYXNoCiMgQWN0aXZhdGUgZW52aXJvbm1lbnQKY29uZGEgYWN0aXZhdGUgU2hvcnRTdGFjazRfZW52CgojIEZpbmQgY29uZGEgcGF0aAp3aGljaCBjb25kYQpgYGAKCi0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKIyBTZXQgUiB2YXJpYWJsZXMKCmBgYHtyIFItdmFyaWFibGVzLCBldmFsPVRSVUV9CnNob3J0c3RhY2tfY29uZGFfZW52X25hbWUgPC0gYygiU2hvcnRTdGFjay00LjAuM19lbnYiKQpzaG9ydHN0YWNrX2NvbmRfcGF0aCA8LSBjKCIvaG9tZS9zYW0vcHJvZ3JhbXMvbWFtYmFmb3JnZS9jb25kYWJpbi9jb25kYSIpCmBgYAoKIyBDcmVhdGUgYSBCYXNoIHZhcmlhYmxlcyBmaWxlCgpUaGlzIGFsbG93cyB1c2FnZSBvZiBCYXNoIHZhcmlhYmxlcyBhY3Jvc3MgUiBNYXJrZG93biBjaHVua3MuCgpgYGB7ciBzYXZlLWJhc2gtdmFyaWFibGVzLXRvLXJ2YXJzLWZpbGUsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KewplY2hvICIjIyMjIEFzc2lnbiBWYXJpYWJsZXMgIyMjIyIKZWNobyAiIgoKZWNobyAiIyBUcmltbWVkIEZhc3RRIG5hbWluZyBwYXR0ZXJuIgplY2hvICJleHBvcnQgdHJpbW1lZF9mYXN0cXNfcGF0dGVybj0nKmZhc3RwLWFkYXB0ZXJzLXBvbHlHLTMxYnAtbWVyZ2VkLmZxLmd6JyIKCmVjaG8gIiMgRGF0YSBkaXJlY3RvcmllcyIKZWNobyAnZXhwb3J0IGRlZXBfZGl2ZV9kaXI9L2hvbWUvc2hhcmVkLzhUQl9IRERfMDEvc2FtL2dpdHJlcG9zL2RlZXAtZGl2ZScKZWNobyAnZXhwb3J0IGRlZXBfZGl2ZV9kYXRhX2Rpcj0iJHtkZWVwX2RpdmVfZGlyfS9kYXRhIicKZWNobyAnZXhwb3J0IG91dHB1dF9kaXJfdG9wPSR7ZGVlcF9kaXZlX2Rpcn0vRi1QbWVhL291dHB1dC8xMy4yLjEtUG1lYS1zUk5Bc2VxLVNob3J0U3RhY2stMzFicC1mYXN0cC1tZXJnZWQtY25pZGFyaWFuX21pUkJhc2UnCmVjaG8gJ2V4cG9ydCB0cmltbWVkX2Zhc3Rxc19kaXI9IiR7ZGVlcF9kaXZlX2Rpcn0vRi1QbWVhL291dHB1dC8wOC4yLVBtZWEtc1JOQXNlcS10cmltbWluZy0zMWJwLWZhc3RwLW1lcmdlZC90cmltbWVkLXJlYWRzIicKZWNobyAiIgoKZWNobyAiIyBJbnB1dC9PdXRwdXQgZmlsZXMiCmVjaG8gJ2V4cG9ydCBnZW5vbWVfZmFzdGFfZGlyPSR7ZGVlcF9kaXZlX2Rpcn0vRi1QbWVhL2RhdGEnCmVjaG8gJ2V4cG9ydCBnZW5vbWVfZmFzdGFfbmFtZT0iUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEuYXNzZW1ibHkuZmFzdGEiJwplY2hvICdleHBvcnQgc2hvcnRzdGFja19nZW5vbWVfZmFzdGFfbmFtZT0iUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEuYXNzZW1ibHkuZmEiJwoKZWNobyAnZXhwb3J0IG1pcmJhc2VfbWF0dXJlX2Zhc3RhX3ZlcnNpb249Y25pZGFyaWFuLW1pcmJhc2UtbWF0dXJlLXYyMi4xLmZhc3RhJwplY2hvICdleHBvcnQgZ2Vub21lX2Zhc3RhPSIke2dlbm9tZV9mYXN0YV9kaXJ9LyR7c2hvcnRzdGFja19nZW5vbWVfZmFzdGFfbmFtZX0iJwplY2hvICIiCgoKZWNobyAiIyBTZXQgbnVtYmVyIG9mIENQVXMgdG8gdXNlIgplY2hvICdleHBvcnQgdGhyZWFkcz00NicKZWNobyAiIgoKZWNobyAiIyBJbml0aWFsaXplIGFycmF5cyIKZWNobyAnZXhwb3J0IHRyaW1tZWRfZmFzdHFzX2FycmF5PSgpJwoKCn0gPiAuYmFzaHZhcnMKCmNhdCAuYmFzaHZhcnMKYGBgCgojIExvYWQgW1Nob3J0U3RhY2tdKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2spIGNvbmRhIGVudmlyb25tZW50CgpJZiB0aGlzIGlzIHN1Y2Nlc3NmdWwsIHRoZSBmaXJzdCBsaW5lIG9mIG91dHB1dCBzaG91bGQgc2hvdyB0aGF0IHRoZSBQeXRob24gYmVpbmcgdXNlZCBpcyB0aGUgb25lIGluIHlvdXIgW1Nob3J0U3RhY2tdKDxodHRwczovL2dpdGh1Yi5jb20vTWlrZUF4dGVsbC9TaG9ydFN0YWNrPiBjb25kYSBlbnZpcm9ubWVudCBwYXRoLgoKRS5nLgoKYHB5dGhvbjogICAgICAgICAvaG9tZS9zYW0vcHJvZ3JhbXMvbWFtYmFmb3JnZS9lbnZzL21pcm1hY2hpbmVfZW52L2Jpbi9weXRob25gCgpgYGB7ciBsb2FkLXNob3J0c3RhY2stY29uZGEtZW52LCBldmFsPVRSVUV9CnVzZV9jb25kYWVudihjb25kYWVudiA9IHNob3J0c3RhY2tfY29uZGFfZW52X25hbWUsIGNvbmRhID0gc2hvcnRzdGFja19jb25kX3BhdGgpCgojIENoZWNrIHN1Y2Nlc3NmdWwgZW52IGxvYWRpbmcKcHlfY29uZmlnKCkKYGBgCgojIFJ1biBTaG9ydFN0YWNrCgojIyBNb2RpZnkgZ2Vub21lIGZpbGVuYW1lIGZvciBTaG9ydFN0YWNrIGNvbXBhdGFiaWxpdHkKCmBgYHtyIHJlbmFtZS1nZW5vbWUtZmlsZW5hbWUsIGVuZ2luZT0nYmFzaCcsIGNhY2hlPVRSVUUsIGV2YWw9VFJVRX0KIyBMb2FkIGJhc2ggdmFyaWFibGVzIGludG8gbWVtb3J5CnNvdXJjZSAuYmFzaHZhcnMKCiMgQ2hlY2sgZm9yIEZhc3RBIGZpbGUgZmlyc3QKIyBUaGVuIGNyZWF0ZSByZW5hbWUgZmlsZSBpZiBkb2Vzbid0IGV4aXN0CmlmIFsgLWYgIiR7Z2Vub21lX2Zhc3RhX2Rpcn0vJHtzaG9ydHN0YWNrX2dlbm9tZV9mYXN0YV9uYW1lfSIgXTsgdGhlbgogIGVjaG8gIiR7Z2Vub21lX2Zhc3RhX2Rpcn0vJHtzaG9ydHN0YWNrX2dlbm9tZV9mYXN0YV9uYW1lfSBhbHJlYWR5IGV4aXN0cy4gTm90aGluZyB0byBkby4iCiAgZWNobyAiIgplbHNlCgogICMgQ29weSBnZW5vbWUgRmFzdEEgdG8gU2hvcnRTdGFjay1jb21wYXRpYmxlIGZpbGVuYW1lIChlbmRpbmcgd2l0aCAuZmEpCiAgY3AgJHtnZW5vbWVfZmFzdGFfZGlyfS8ke2dlbm9tZV9mYXN0YV9uYW1lfSAke2dlbm9tZV9mYXN0YV9kaXJ9LyR7c2hvcnRzdGFja19nZW5vbWVfZmFzdGFfbmFtZX0KZmkKCiMgQ29uZmlybQpscyAtbGggJHtnZW5vbWVfZmFzdGFfZGlyfS8ke3Nob3J0c3RhY2tfZ2Vub21lX2Zhc3RhX25hbWV9CmBgYAoKIyMgRXhjZWN1dGUgU2hvcnRTdGFjayBjb21tYW5kCgpVc2VzIHRoZSBgLS1kbl9taXJuYWAgb3B0aW9uIHRvIGlkZW50aWZ5IG1pUk5BcyBpbiB0aGUgZ2Vub21lLCB3aXRob3V0IHJlbHlpbmcgb24gdGhlIGAtLWtub3duX21pUk5Bc2AuCgpUaGlzIHBhcnQgb2YgdGhlIGNvZGUgcmVkaXJlY3RzIHRoZSBvdXRwdXQgb2YgYHRpbWVgIHRvIHRoZSBlbmQgb2YgYHNob3J0c3RhY2subG9nYCBmaWxlLgoKLSAgIGA7IH0gXCAyPj4gJHtvdXRwdXRfZGlyX3RvcH0vc2hvcnRzdGFjay5sb2dgCgoKCmBgYHtyIHNob3J0c3RhY2ssIGVuZ2luZT0nYmFzaCcsIGNhY2hlPVRSVUV9CiMgTG9hZCBiYXNoIHZhcmlhYmxlcyBpbnRvIG1lbW9yeQpzb3VyY2UgLmJhc2h2YXJzCgojIE1ha2Ugb3V0cHV0IGRpcmVjdG9yeSwgaWYgaXQgZG9lc24ndCBleGlzdApta2RpciAtLXBhcmVudHMgIiR7b3V0cHV0X2Rpcl90b3B9IgoKIyBDcmVhdGUgYXJyYXkgb2YgdHJpbW1lZCBGYXN0UXMKdHJpbW1lZF9mYXN0cXNfYXJyYXk9KCR7dHJpbW1lZF9mYXN0cXNfZGlyfS8ke3RyaW1tZWRfZmFzdHFzX3BhdHRlcm59KQoKCiMgUGFzcyBhcnJheSBjb250ZW50cyB0byBuZXcgdmFyaWFibGUgYXMgc3BhY2UtZGVsaW1pdGVkIGxpc3QKdHJpbW1lZF9mYXN0cXNfbGlzdD0kKGVjaG8gIiR7dHJpbW1lZF9mYXN0cXNfYXJyYXlbKl19IikKCgojIyMjIyMgUnVuIFNob3J0U3RhY2sgIyMjIyMjCnsgdGltZSBcClNob3J0U3RhY2sgXAotLWdlbm9tZWZpbGUgIiR7Z2Vub21lX2Zhc3RhfSIgXAotLXJlYWRmaWxlICR7dHJpbW1lZF9mYXN0cXNfbGlzdH0gXAotLWtub3duX21pUk5BcyAke2RlZXBfZGl2ZV9kYXRhX2Rpcn0vJHttaXJiYXNlX21hdHVyZV9mYXN0YV92ZXJzaW9ufSBcCi0tZG5fbWlybmEgXAotLXRocmVhZHMgJHt0aHJlYWRzfSBcCi0tb3V0ZGlyICR7b3V0cHV0X2Rpcl90b3B9L1Nob3J0U3RhY2tfb3V0IFwKJj4gJHtvdXRwdXRfZGlyX3RvcH0vc2hvcnRzdGFjay5sb2cgOyB9IFwKMj4+ICR7b3V0cHV0X2Rpcl90b3B9L3Nob3J0c3RhY2subG9nCgpgYGAKCiMjIENoZWNrIHJ1bnRpbWUKCmBgYHtyIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KIyBMb2FkIGJhc2ggdmFyaWFibGVzIGludG8gbWVtb3J5CnNvdXJjZSAuYmFzaHZhcnMKCnRhaWwgLW4gMyAke291dHB1dF9kaXJfdG9wfS9zaG9ydHN0YWNrLmxvZyBcCnwgZ3JlcCAicmVhbCIgXAp8IGF3ayAne3ByaW50ICJTaG9ydFN0YWNrIHJ1bnRpbWU6IiAiXHQiICQyfScKCmBgYAoKCiMgUmVzdWx0cwoKIyMgU2hvcnRTdGFjayBzeW5vcHNpcwoKYGBge3Igc2hvcnRzdGFjay1zeW5vcHNpcywgZW5naW5lPSdiYXNoJywgZXZhbD1UUlVFfQojIExvYWQgYmFzaCB2YXJpYWJsZXMgaW50byBtZW1vcnkKc291cmNlIC5iYXNodmFycwoKdGFpbCAtbiAyNSAke291dHB1dF9kaXJfdG9wfS9zaG9ydHN0YWNrLmxvZwpgYGAKClNob3J0U3RhY2sgaWRlbnRpZmllZCAzNyBtaVJOQXMuCgojIyBJbnNwZWN0IGBSZXN1bHRzLnR4dGAKCmBgYHtyIHJlc3VsdHMtdHh0LWZpbGUsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KIyBMb2FkIGJhc2ggdmFyaWFibGVzIGludG8gbWVtb3J5CnNvdXJjZSAuYmFzaHZhcnMKCmhlYWQgJHtvdXRwdXRfZGlyX3RvcH0vU2hvcnRTdGFja19vdXQvUmVzdWx0cy50eHQKCmVjaG8gIiIKZWNobyAiLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLSIKZWNobyAiIgoKZWNobyAiTnVtbWJlciBvZiBwb3RlbnRpYWwgbG9jaToiCmF3ayAnKE5SPjEpJyAke291dHB1dF9kaXJfdG9wfS9TaG9ydFN0YWNrX291dC9SZXN1bHRzLnR4dCB8IHdjIC1sCmBgYAoKQ29sdW1uIDIwIG9mIHRoZSBgUmVzdWx0cy50eHRgIGZpbGUgaWRlbnRpZmllcyBpZiBhIGNsdXN0ZXIgaXMgYSBtaVJOQSBvciBub3QgKGBZYCBvciBgTmApLgoKYGBge3IgcmVzdWx0cy10eHQtbWlSTkFzLCBlbmdpbmU9J2Jhc2gnLCBldmFsPVRSVUV9CiMgTG9hZCBiYXNoIHZhcmlhYmxlcyBpbnRvIG1lbW9yeQpzb3VyY2UgLmJhc2h2YXJzCgplY2hvICJOdW1iZXIgb2YgbG9jaSBjaGFyYWN0ZXJpemVkIGFzIG1pUk5BOiIKYXdrICckMjA9PSJZIiB7cHJpbnQgJDB9JyAke291dHB1dF9kaXJfdG9wfS9TaG9ydFN0YWNrX291dC9SZXN1bHRzLnR4dCBcCnwgd2MgLWwKZWNobyAiIgoKZWNobyAiLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLSIKCmVjaG8gIiIKZWNobyAiTnVtYmVyIG9mIGxvY2kgX25vdF8gY2hhcmFjdGVyaXplZCBhcyBtaVJOQToiCmF3ayAnJDIwPT0iTiIge3ByaW50ICQwfScgJHtvdXRwdXRfZGlyX3RvcH0vU2hvcnRTdGFja19vdXQvUmVzdWx0cy50eHQgXAp8IHdjIC1sCgpgYGAKCkNvbHVtbiAyMSBvZiB0aGUgYFJlc3VsdHMudHh0YCBmaWxlIGlkZW50aWZpZXMgaWYgYSBjbHVzdGVyIGFsaWduZWQgdG8gYSBrbm93biBtaVJOQSAobWlSQmFzZSkgb3Igbm90IChgWWAgb3IgYE5BYCkuCgoKVGhlIGBlY2hvYCBjb21tYW5kIGFmdGVyIHRoZSBgYXdrYCBjb21tYW5kIGlzIHNpbXBseSB0aGVyZSB0byBwcm92ZSB0aGF0IHRoZSBjaHVuayBleGVjdXRlZC4KCmBgYHtyIHJlc3VsdHMtdHh0LW1pUkJhc2UtbWlSTkFzLCBlbmdpbmU9J2Jhc2gnLCBldmFsPVRSVUV9CiMgTG9hZCBiYXNoIHZhcmlhYmxlcyBpbnRvIG1lbW9yeQpzb3VyY2UgLmJhc2h2YXJzCgplY2hvICJOdW1iZXIgb2YgbG9jaSBtYXRjaGluZyBtaVJCYXNlIG1pUk5BczoiCmF3ayAnJDIxIT0iTkEiIHtwcmludCAkMH0nICR7b3V0cHV0X2Rpcl90b3B9L1Nob3J0U3RhY2tfb3V0L1Jlc3VsdHMudHh0IFwKfCB3YyAtbAplY2hvICIiCgplY2hvICItLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tIgoKZWNobyAiIgplY2hvICJOdW1iZXIgb2YgbG9jaSBfbm90XyBtYXRjaGluZyBtaVJCYXNlIG1pUk5BczoiCmF3ayAnJDIxPT0iTkEiIHtwcmludCAkMH0nICR7b3V0cHV0X2Rpcl90b3B9L1Nob3J0U3RhY2tfb3V0L1Jlc3VsdHMudHh0IFwKfCB3YyAtbAoKYGBgCgpBbHRob3VnaCB0aGVyZSBhcmUgbG9jaSB3aXRoIG1hdGNoZXMgdG8gbWlSQmFzZSBtaVJOQXMsIFNob3J0U3RhY2sgZGlkICpub3QqIGFubm90YXRlIHRoZXNlIGNsdXN0ZXJzIGFzIG1pUk5BcyBsaWtlbHkgW2JlY2F1c2UgdGhleSBkbyBub3QgKmFsc28qIG1hdGNoIHNlY29uZGFyeSBzdHJ1Y3R1cmUgY3JpdGVyaWFdKGh0dHBzOi8vZ2l0aHViLmNvbS9NaWtlQXh0ZWxsL1Nob3J0U3RhY2sjbWlybmEtYW5ub3RhdGlvbikuCgojIyMgRGlyZWN0b3J5IHRyZWUgb2YgYWxsIFNob3J0U3RhY2sgb3V0cHV0cwoKTWFueSBvZiB0aGVzZSBhcmUgbGFyZ2UgKGJ5IEdpdEh1YiBzdGFuZGFyZHMpIEJBTSBmaWxlcywgc28gd2lsbCBub3QgYmUgYWRkZWQgdG8gdGhlIHJlcG8uCgpBZGRpdGlvbmFsbHksIGl0J3MgdW5saWtlbHkgd2UnbGwgdXRpbGl6ZSBtb3N0IG9mIHRoZSBvdGhlciBmaWxlcyAoYmlnd2lnKSBnZW5lcmF0ZWQgYnkgU2hvcnRTdGFjay4KCmBgYHtyIHNob3J0c3RhY2stZGlyZWN0b3J5LXRyZWUsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KIyBMb2FkIGJhc2ggdmFyaWFibGVzIGludG8gbWVtb3J5CnNvdXJjZSAuYmFzaHZhcnMKCnRyZWUgLWggJHtvdXRwdXRfZGlyX3RvcH0vCgpgYGAKCiMjIFZpc3VhbGl6ZQoKV2Ugbm90aWNlZCB0aGF0IGEpIG5vdCBhbGwgb2YgdGhlIGlkZW50aWZpZWQgbWlSTkFzIGhhdmUgZGF0YWJhc2UgbWF0Y2hlcywgYW5kIGIpIHNvbWUgcmVhZHMgaGF2ZSBhIG1hdGNoIGluIHRoZSBkYXRhYmFzZSBidXQgYXJlICpub3QqIGNsYXNzaWZpZWQgYXMgbWlSTkFzLiBMZXQncyBsb29rIGF0IHRoaXMgaW4gbW9yZSBkZXB0aC4KCmBgYHtyIGxvYWQtcmVzdWx0cywgZXZhbD1UUlVFfQpQbWVhX3Nob3J0c3RhY2tfcmVzdWx0cyA8LSByZWFkLmNzdigiLi4vb3V0cHV0LzEzLjIuMS1QbWVhLXNSTkFzZXEtU2hvcnRTdGFjay0zMWJwLWZhc3RwLW1lcmdlZC1jbmlkYXJpYW5fbWlSQmFzZS9TaG9ydFN0YWNrX291dC9SZXN1bHRzLnR4dCIsIHNlcD0iXHQiKQpgYGAKCmBgYHtyIGdlbmVyYXRlLXBsb3RzLCBldmFsPVRSVUV9CiMgUmVhZHMgaWRlbnRpZmllZCBhcyBtaVJOQXMgKGJ1dCBub3QgbmVjZXNzYXJpbHkga25vd24pClBtZWFfc2hvcnRzdGFja19yZXN1bHRzICU+JSAKICBmaWx0ZXIoTUlSTkEgPT0gIlkiKSAlPiUKICBtdXRhdGUoa25vd25fbWlSTkFzID0gc3RyX3N1Yihrbm93bl9taVJOQXMsIDEsIDQwKSkgJT4lCiAgbXV0YXRlKExvY3VzID0gc3RyX3N1YihMb2N1cywgMjAsIDQwKSkgJT4lCiAgZ2dwbG90KGFlcyh4ID0gcmVvcmRlcihMb2N1cywgUmVhZHMpLCB5ID0gUmVhZHMsIGZpbGwgPSBrbm93bl9taVJOQXMpKSArCiAgZ2VvbV9iYXIoc3RhdCA9ICJpZGVudGl0eSIsIHBvc2l0aW9uID0gImRvZGdlIikgKwogIGdlb21fdGV4dChhZXMobGFiZWwgPSBSZWFkcyksIHZqdXN0ID0gLTAuNSwgcG9zaXRpb24gPSBwb3NpdGlvbl9kb2RnZSh3aWR0aCA9IC0wLjUpLCBjb2xvciA9ICJibGFjayIsIHNpemUgPSAyLjUsIGFuZ2xlID0gOTApICsKICBsYWJzKHggPSAibWlSTkEiLCB5ID0gIlJlYWQgY291bnQiLCAKICAgICAgIHRpdGxlID0gIlJlYWRzIGlkZW50aWZpZWQgYnkgU2hvcnRTdGFjayBhcyBtaVJOQXMiLAogICAgICAgZmlsbCA9ICJBbm5vdGF0aW9uIikgKwogIHRoZW1lKGF4aXMudGV4dC54ID0gZWxlbWVudF9ibGFuaygpLAogICAgICAgIGF4aXMudGlja3MueCA9IGVsZW1lbnRfYmxhbmsoKSkKICAKZ2dzYXZlKCIuLi9vdXRwdXQvMTMuMi4xLVBtZWEtc1JOQXNlcS1TaG9ydFN0YWNrLTMxYnAtZmFzdHAtbWVyZ2VkLWNuaWRhcmlhbl9taVJCYXNlL2ZpZ3VyZXMvUG1lYV9TaG9ydFN0YWNrX21pUk5BX2hpc3RvZ3JhbS5wbmciLCB3aWR0aCA9IDEyLCBoZWlnaHQgPSA3LCB1bml0cyA9ICJpbiIpCgoKIyBSZWFkcyBtYXRjaGVkIGluIHRoZSByZWZlcmVuY2UgZGIgKGJ1dCBub3QgbmVjZXNzYXJpbHkgaWRlbnRpZmllZCBhcyBtaVJOQSkKUG1lYV9zaG9ydHN0YWNrX3Jlc3VsdHMgJT4lIAogIGZpbHRlcighaXMubmEoa25vd25fbWlSTkFzKSkgJT4lCiAgbXV0YXRlKGtub3duX21pUk5BcyA9IHN0cl9zdWIoa25vd25fbWlSTkFzLCAxLCA0MCkpICU+JQogIG11dGF0ZShMb2N1cyA9IHN0cl9zdWIoTG9jdXMsIDIwLCA0MCkpICU+JQogIGdncGxvdChhZXMoeCA9IHJlb3JkZXIoTG9jdXMsIFJlYWRzKSwgeSA9IFJlYWRzLCBmaWxsID0gTUlSTkEpKSArCiAgZ2VvbV9iYXIoc3RhdCA9ICJpZGVudGl0eSIsIHBvc2l0aW9uID0gImRvZGdlIikgKwogIGdlb21fdGV4dChhZXMobGFiZWwgPSBSZWFkcyksIHZqdXN0ID0gMC41LCBwb3NpdGlvbiA9IHBvc2l0aW9uX2RvZGdlKHdpZHRoID0gLTAuNSksIGNvbG9yID0gImJsYWNrIiwgc2l6ZSA9IDIuNSwgYW5nbGUgPSA5MCkgKwogIGxhYnMoeCA9ICJtaVJOQSIsIHkgPSAiUmVhZCBjb3VudCIsIAogICAgICAgdGl0bGUgPSAiUmVhZHMgd2l0aCBtaVJCYXNlK2NuaWRhcmlhbiBkYXRhYmFzZSBtYXRjaGVzIiwKICAgICAgIGZpbGwgPSAiSWRlbnRpZmllZCBhcyBtaVJOQT8iKSArCiAgdGhlbWUoYXhpcy50ZXh0LnggPSBlbGVtZW50X2JsYW5rKCksCiAgICAgICAgYXhpcy50aWNrcy54ID0gZWxlbWVudF9ibGFuaygpKQoKZ2dzYXZlKCIuLi9vdXRwdXQvMTMuMi4xLVBtZWEtc1JOQXNlcS1TaG9ydFN0YWNrLTMxYnAtZmFzdHAtbWVyZ2VkLWNuaWRhcmlhbl9taVJCYXNlL2ZpZ3VyZXMvUG1lYV9TaG9ydFN0YWNrX2RibWF0Y2hfaGlzdG9ncmFtLnBuZyIsIHdpZHRoID0gMTIsIGhlaWdodCA9IDcsIHVuaXRzID0gImluIikKYGBgCgpUaGVyZSdzIG9uZSBtaVJOQSB3aXRoIGEgdmVyeSBoaWdoIHJlYWQgY291bnQsIGFuZCBpdCdzIG1ha2luZyB2aXN1YWxpemF0aW9uIG9mIHRoZSByZXN0IGRpZmZpY3VsdC4gTGV0J3MgcmVtb3ZlIGl0IGFuZCByZXRyeSB2aXN1YWxpemluZyB0aGUgcmVzdC4KCmBgYHtyIGdlbmVyYXRlLXBsb3RzLXJlZHVjZWQsIGV2YWw9VFJVRX0KIyBSZWFkcyBpZGVudGlmaWVkIGFzIG1pUk5BcyAoYnV0IG5vdCBuZWNlc3NhcmlseSBrbm93bikKUG1lYV9zaG9ydHN0YWNrX3Jlc3VsdHMgJT4lIAogIGZpbHRlcihNSVJOQSA9PSAiWSIpICU+JQogIGZpbHRlcihSZWFkcyA8IDIwMDAwMCkgJT4lCiAgbXV0YXRlKGtub3duX21pUk5BcyA9IHN0cl9zdWIoa25vd25fbWlSTkFzLCAxLCA0MCkpICU+JQogIG11dGF0ZShMb2N1cyA9IHN0cl9zdWIoTG9jdXMsIDIwLCA0MCkpICU+JQogIGdncGxvdChhZXMoeCA9IHJlb3JkZXIoTG9jdXMsIFJlYWRzKSwgeSA9IFJlYWRzLCBmaWxsID0ga25vd25fbWlSTkFzKSkgKwogIGdlb21fYmFyKHN0YXQgPSAiaWRlbnRpdHkiLCBwb3NpdGlvbiA9ICJkb2RnZSIpICsKICAgZ2VvbV90ZXh0KGFlcyhsYWJlbCA9IFJlYWRzKSwgdmp1c3QgPSAwLjUsIGhqdXN0ID0gMCwgY29sb3IgPSAiYmxhY2siLCBzaXplID0gMi41LCBhbmdsZSA9IDkwKSArCiAgbGFicyh4ID0gIm1pUk5BIiwgeSA9ICJSZWFkIGNvdW50IiwgCiAgICAgICB0aXRsZSA9ICJSZWFkcyBpZGVudGlmaWVkIGJ5IFNob3J0U3RhY2sgYXMgbWlSTkFzIiwKICAgICAgIGZpbGwgPSAiQW5ub3RhdGlvbiIpICsKICB0aGVtZShheGlzLnRleHQueCA9IGVsZW1lbnRfYmxhbmsoKSwKICAgICAgICBheGlzLnRpY2tzLnggPSBlbGVtZW50X2JsYW5rKCkpCiAgCmdnc2F2ZSgiLi4vb3V0cHV0LzEzLjIuMS1QbWVhLXNSTkFzZXEtU2hvcnRTdGFjay0zMWJwLWZhc3RwLW1lcmdlZC1jbmlkYXJpYW5fbWlSQmFzZS9maWd1cmVzL1BtZWFfU2hvcnRTdGFja19taVJOQV9oaXN0b2dyYW1fcmVkdWNlZC5wbmciLCB3aWR0aCA9IDEyLCBoZWlnaHQgPSA3LCB1bml0cyA9ICJpbiIpCgpgYGAKCmBgYHtyIHZlbm4tZGlhZ3JhbSwgZXZhbD1UUlVFfQojIE1ha2UgbGlzdAptaXJuYXMgPC0gUG1lYV9zaG9ydHN0YWNrX3Jlc3VsdHMgJT4lIGZpbHRlcihNSVJOQSA9PSAiWSIpICU+JSBwdWxsKExvY3VzKQptYXRjaGVzIDwtIFBtZWFfc2hvcnRzdGFja19yZXN1bHRzICU+JSBmaWx0ZXIoIWlzLm5hKGtub3duX21pUk5BcykpICU+JSBwdWxsKExvY3VzKQoKUG1lYV9zaG9ydHN0YWNrX3Zlbm5saXN0IDwtIGxpc3QoCiAgIklkZW50aWZpZWQgYXMgbWlSTkEiID0gbWlybmFzLAogICJEYXRhYmFzZSBtYXRjaCIgPSBtYXRjaGVzCikKCiMgTWFrZSB2ZW5uIGRpYWdyYW1zCmdndmVubihQbWVhX3Nob3J0c3RhY2tfdmVubmxpc3QpCgpnZ3NhdmUoIi4uL291dHB1dC8xMy4yLjEtUG1lYS1zUk5Bc2VxLVNob3J0U3RhY2stMzFicC1mYXN0cC1tZXJnZWQtY25pZGFyaWFuX21pUkJhc2UvZmlndXJlcy9QbWVhX1Nob3J0U3RhY2tfdmVubi5wbmciLCB3aWR0aCA9IDEyLCBoZWlnaHQgPSA3LCB1bml0cyA9ICJpbiIpCmBgYAoKCi0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQoKIyBDaXRhdGlvbnM=

13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase

Sam White

2024-02-16

1 Set R variables

2 Create a Bash variables file

3 Load ShortStack conda environment

4 Run ShortStack

4.1 Modify genome filename for ShortStack compatability

4.2 Excecute ShortStack command

4.3 Check runtime

5 Results

5.1 ShortStack synopsis

5.2 Inspect `Results.txt`

5.2.1 Directory tree of all ShortStack outputs

5.3 Visualize

Citations

13.2.1-Pmea-sRNAseq-ShortStack-31bp-fastp-merged-cnidarian_miRBase

Sam White

2024-02-16

1 Set R variables

2 Create a Bash variables file

3 Load ShortStack conda environment

4 Run ShortStack

4.1 Modify genome filename for ShortStack compatability

4.2 Excecute ShortStack command

4.3 Check runtime

5 Results

5.1 ShortStack synopsis

5.2 Inspect Results.txt

5.2.1 Directory tree of all ShortStack outputs

5.3 Visualize

Citations

5.2 Inspect `Results.txt`