Code to annotate our P. tuahiniensis reference files (the P. meandrina transcriptome and genome) with GO information

1 Transcriptome

1.1 Retrieve transcriptome fasta file

We’ll be using the P. meandrina genes fasta file stored here. Accessible on the deep-dive genomic resources page.

curl https://gannet.fish.washington.edu/acropora/E5-deep-dive/Transcripts/Pocillopora_meandrina_HIv1.genes.cds.fna \
-k \
> ../../data/Pocillopora_meandrina_HIv1.genes.cds.fna

Let’s check the file

echo "First few lines:"
head -3 ../../data/Pocillopora_meandrina_HIv1.genes.cds.fna

echo ""
echo "How many sequences are there?"
grep -c ">" ../../data/Pocillopora_meandrina_HIv1.genes.cds.fna

## First few lines:
## >Pocillopora_meandrina_HIv1___RNAseq.g5351.t1
## ATGGGAACATCCATTTCGAAAAAACTTGAGGAGCAACAGAAAACCAAGGACGAGAAAGCCGTGGAAGAGCTGCAGATGCTGCAAGAGATGATGGTTAATAAAGTTGCCGCCGCCAGAGCAGAGATGAGGGAAAAGGCGCTCAAAGACGCTAATGTCCCGATTGTGGCGTTTGTCGACACATCAGAGAAGTATTCTGTCGACGTGTCGAACGCGCCTGATGATGCCATAACTACATCGATCAAAGAAATGTTTGGTGGAAACATCAAACAGGGTCTTGTGAGCCTCATCGGCGTGGCCCTCAACCAGTTCTTGGGAAACACTCAGGCTGGCGTAAGTGGGCAGAACGATTACCACATCGTCTTTAGCGATAACGCCCTCTTGCGAATCGATGTTATGTTTTACAAATACGAGTTTTCATCCAAAGGAGTAAAAGATGAACGTCGGAATGGGTTCTGCTACTGCACACAAGCTGCTGTTGTTGACCTCAAAAAGGTGAGCCCGGAAGTCTTGCTGTACGAGCTCACACGTACGATTGGCCAGGAAAATATTCCCGACGCAGTAAAACAGCTTCATTTAATGGCTGAATTTGGAGAGCAGTTGTACCAAGTTGTCAACGAGTTGAACACCGCTGCCGAGAAAACCCTCCCAGATTCTGACGATGGTGCTGGTCGTAAGAAACAAATAAGAAATTCAAGCCAAGAAGAGGATGATGAAGAACATGATGACTGA
## >Pocillopora_meandrina_HIv1___RNAseq.g22918.t1
## 
## How many sequences are there?
## 31840

# Read FASTA file
fasta_file <- "../../data/Pocillopora_meandrina_HIv1.genes.cds.fna"  # Replace with the name of your FASTA file
sequences <- readDNAStringSet(fasta_file)

# Calculate sequence lengths
sequence_lengths <- width(sequences)

# Create a data frame
sequence_lengths_df <- data.frame(Length = sequence_lengths)

# Plot histogram using ggplot2
ggplot(sequence_lengths_df, aes(x = Length)) +
  geom_histogram(binwidth = 1, color = "black", fill = "blue", alpha = 0.75) +
  labs(title = "Histogram of Sequence Lengths",
       x = "Sequence Length",
       y = "Frequency") +
  theme_minimal()

summary(sequence_lengths_df)

##      Length     
##  Min.   :   30  
##  1st Qu.:  534  
##  Median :  957  
##  Mean   : 1377  
##  3rd Qu.: 1642  
##  Max.   :63966

# Calculate base composition
base_composition <- alphabetFrequency(sequences, baseOnly = TRUE)

# Convert to data frame and reshape for ggplot2
base_composition_df <- as.data.frame(base_composition)
base_composition_df$ID <- rownames(base_composition_df)
base_composition_melted <- reshape2::melt(base_composition_df, id.vars = "ID", variable.name = "Base", value.name = "Count")

# Plot base composition bar chart using ggplot2
ggplot(base_composition_melted, aes(x = Base, y = Count, fill = Base)) +
  geom_bar(stat = "identity", position = "dodge", color = "black") +
  labs(title = "Base Composition",
       x = "Base",
       y = "Count") +
  theme_minimal() +
  scale_fill_manual(values = c("A" = "green", "C" = "blue", "G" = "yellow", "T" = "red"))

# Count CG motifs in each sequence
count_cg_motifs <- function(sequence) {
  cg_motif <- "CG"
  return(length(gregexpr(cg_motif, sequence, fixed = TRUE)[[1]]))
}

cg_motifs_counts <- sapply(sequences, count_cg_motifs)

# Create a data frame
cg_motifs_counts_df <- data.frame(CG_Count = cg_motifs_counts)

# Plot CG motifs distribution using ggplot2
ggplot(cg_motifs_counts_df, aes(x = CG_Count)) +
  geom_histogram(binwidth = 1, color = "black", fill = "blue", alpha = 0.75) +
  labs(title = "Distribution of CG Motifs",
       x = "Number of CG Motifs",
       y = "Frequency") +
  theme_minimal()

1.2 Database Creation

1.2.1 Obtain Fasta (UniProt/Swiss-Prot)

cd ../../data
curl -O https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz
mv uniprot_sprot.fasta.gz uniprot_sprot_r2023_04.fasta.gz
gunzip -k uniprot_sprot_r2023_04.fasta.gz

1.2.2 Making the database

/home/shared/ncbi-blast-2.11.0+/bin/makeblastdb \
-in ../../data/uniprot_sprot_r2023_04.fasta \
-dbtype prot \
-out ../../blastdb/uniprot_sprot_r2023_04

1.3 Running Blastx

/home/shared/ncbi-blast-2.11.0+/bin/blastx \
-query ../../data/Pocillopora_meandrina_HIv1.genes.cds.fna \
-db ../../blastdb/uniprot_sprot_r2023_04 \
-out ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx.tab \
-evalue 1E-20 \
-num_threads 40 \
-max_target_seqs 1 \
-outfmt 6

echo "First few lines:"
head -2 ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx.tab

echo "Number of lines in output:"
wc -l ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx.tab

## First few lines:
## Pocillopora_meandrina_HIv1___RNAseq.g27719.t1    sp|Q7ZT01|PSF3_XENLA    46.465  198 106 0   19  612 7   204 3.67e-66    205
## Pocillopora_meandrina_HIv1___RNAseq.g14270.t1    sp|P55112|NAS4_CAEEL    39.548  177 102 2   298 825 74  246 1.16e-38    141
## Number of lines in output:
## 18087 ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx.tab

1.4 Joining Blast table with annoations.

1.4.1 Prepping Blast table for easy join

tr '|' '\t' < ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx.tab \
> ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx_sep.tab

head -1 ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx_sep.tab

## Pocillopora_meandrina_HIv1___RNAseq.g27719.t1    sp  Q7ZT01  PSF3_XENLA  46.465  198 106 0   19  612 7   204 3.67e-66    205

1.4.2 Could do some cool stuff in R here reading in table

bltabl <- read.csv("../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-uniprot_blastx_sep.tab", sep = '\t', header = FALSE)

spgo <- read.csv("https://gannet.fish.washington.edu/seashell/snaps/uniprot_table_r2023_01.tab", sep = '\t', header = TRUE)

datatable(head(bltabl), options = list(scrollX = TRUE, scrollY = "400px", scrollCollapse = TRUE, paging = FALSE))

datatable(head(spgo), options = list(scrollX = TRUE, scrollY = "400px", scrollCollapse = TRUE, paging = FALSE))

datatable(
  left_join(bltabl, spgo,  by = c("V3" = "Entry")) %>%
  select(V1, V3, V13, Protein.names, Organism, Gene.Ontology..biological.process., Gene.Ontology.IDs)
)

annot_tab <-
  left_join(bltabl, spgo,  by = c("V3" = "Entry")) %>%
  select(V1, V3, V13, Protein.names, Organism, Gene.Ontology..biological.process., Gene.Ontology.IDs)

write.table(annot_tab, file = "../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-IDmapping-2024_09_04.tab", sep = "\t",
            row.names = TRUE, col.names = NA)

head -n 3 ../output/02-Ptuh-reference-annotation/Pocillopora_meandrina_HIv1-IDmapping-2024_09_04.tab

# Read dataset
#dataset <- read.csv("../output/blast_annot_go.tab", sep = '\t')  # Replace with the path to your dataset

# Select the column of interest
column_name <- "Organism"  # Replace with the name of the column of interest
column_data <- annot_tab[[column_name]]

# Count the occurrences of the strings in the column
string_counts <- table(column_data)

# Convert to a data frame, sort by count, and select the top 10
string_counts_df <- as.data.frame(string_counts)
colnames(string_counts_df) <- c("String", "Count")
string_counts_df <- string_counts_df[order(string_counts_df$Count, decreasing = TRUE), ]
top_10_strings <- head(string_counts_df, n = 10)

# Plot the top 10 most common strings using ggplot2
ggplot(top_10_strings, aes(x = reorder(String, -Count), y = Count, fill = String)) +
  geom_bar(stat = "identity", position = "dodge", color = "black") +
  labs(title = "Top 10 Species hits",
       x = column_name,
       y = "Count") +
  theme_minimal() +
  theme(legend.position = "none") +
  coord_flip()

#data <- read.csv("../output/blast_annot_go.tab", sep = '\t')

# Rename the `Gene.Ontology..biological.process.` column to `Biological_Process`
colnames(annot_tab)[colnames(annot_tab) == "Gene.Ontology..biological.process."] <- "Biological_Process"

# Separate the `Biological_Process` column into individual biological processes
data_separated <- unlist(strsplit(annot_tab$Biological_Process, split = ";"))

# Trim whitespace from the biological processes
data_separated <- gsub("^\\s+|\\s+$", "", data_separated)

# Count the occurrences of each biological process
process_counts <- table(data_separated)
process_counts <- data.frame(Biological_Process = names(process_counts), Count = as.integer(process_counts))
process_counts <- process_counts[order(-process_counts$Count), ]

# Select the 20 most predominant biological processes
top_20_processes <- process_counts[1:20, ]

# Create a color palette for the bars
bar_colors <- rainbow(nrow(top_20_processes))

# Create a staggered vertical bar plot with different colors for each bar
barplot(top_20_processes$Count, names.arg = rep("", nrow(top_20_processes)), col = bar_colors,
        ylim = c(0, max(top_20_processes$Count) * 1.25),
        main = "Occurrences of the 20 Most Predominant Biological Processes", xlab = "Biological Process", ylab = "Count")

# Create a separate plot for the legend
png("../output/02-Ptuh-reference-annotation/GOlegend.png", width = 800, height = 600)
par(mar = c(0, 0, 0, 0))
plot.new()
legend("center", legend = top_20_processes$Biological_Process, fill = bar_colors, cex = 1, title = "Biological Processes")
dev.off()

## png 
##   2

knitr::include_graphics("../output/02-Ptuh-reference-annotation/GOlegend.png")

rm ../output/02-Ptuh-reference-annotation/GOlegend.png

LS0tCnRpdGxlOiAiMDItUHR1aC1yZWZlcmVuY2UtYW5ub3RhdGlvbiIKYXV0aG9yOiAiS2F0aGxlZW4gRHVya2luIgpkYXRlOiAiMjAyNC0wOS0wNCIKYWx3YXlzX2FsbG93X2h0bWw6IHRydWUKb3V0cHV0OiAKICBib29rZG93bjo6aHRtbF9kb2N1bWVudDI6CiAgICB0aGVtZTogY29zbW8KICAgIHRvYzogdHJ1ZQogICAgdG9jX2Zsb2F0OiB0cnVlCiAgICBudW1iZXJfc2VjdGlvbnM6IHRydWUKICAgIGNvZGVfZm9sZGluZzogc2hvdwogICAgY29kZV9kb3dubG9hZDogdHJ1ZQogIGdpdGh1Yl9kb2N1bWVudDoKICAgIHRvYzogdHJ1ZQogICAgdG9jX2RlcHRoOiAzCiAgICBudW1iZXJfc2VjdGlvbnM6IHRydWUKICAgIGh0bWxfcHJldmlldzogdHJ1ZSAKLS0tCgpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0KbGlicmFyeShrbml0cikKbGlicmFyeSh0aWR5dmVyc2UpCmxpYnJhcnkoa2FibGVFeHRyYSkKbGlicmFyeShEVCkKbGlicmFyeShCaW9zdHJpbmdzKQpsaWJyYXJ5KHRtKQprbml0cjo6b3B0c19jaHVuayRzZXQoCiAgZWNobyA9IFRSVUUsICAgICAgICAgIyBEaXNwbGF5IGNvZGUgY2h1bmtzCiAgZXZhbCA9IEZBTFNFLCAgICAgICAgICMgRXZhbHVhdGUgY29kZSBjaHVua3MKICB3YXJuaW5nID0gRkFMU0UsICAgICAjIEhpZGUgd2FybmluZ3MKICBtZXNzYWdlID0gRkFMU0UsICAgICAjIEhpZGUgbWVzc2FnZXMKICBmaWcud2lkdGggPSA2LCAgICAgICAjIFNldCBwbG90IHdpZHRoIGluIGluY2hlcwogIGZpZy5oZWlnaHQgPSA0LCAgICAgICMgU2V0IHBsb3QgaGVpZ2h0IGluIGluY2hlcwogIGZpZy5hbGlnbiA9ICJjZW50ZXIiICMgQWxpZ24gcGxvdHMgdG8gdGhlIGNlbnRlcgopCmBgYAoKQ29kZSB0byBhbm5vdGF0ZSBvdXIgKlAuIHR1YWhpbmllbnNpcyogcmVmZXJlbmNlIGZpbGVzICh0aGUgKlAuIG1lYW5kcmluYSogdHJhbnNjcmlwdG9tZSBhbmQgZ2Vub21lKSB3aXRoIEdPIGluZm9ybWF0aW9uCgojIFRyYW5zY3JpcHRvbWUKIyMgUmV0cmlldmUgdHJhbnNjcmlwdG9tZSBmYXN0YSBmaWxlCgpXZSdsbCBiZSB1c2luZyB0aGUgKlAuIG1lYW5kcmluYSogZ2VuZXMgZmFzdGEgZmlsZSBzdG9yZWQgW2hlcmVdKGh0dHBzOi8vZ2FubmV0LmZpc2gud2FzaGluZ3Rvbi5lZHUvYWNyb3BvcmEvRTUtZGVlcC1kaXZlL1RyYW5zY3JpcHRzL1BvY2lsbG9wb3JhX21lYW5kcmluYV9ISXYxLmdlbmVzLmNkcy5mbmEpLiBBY2Nlc3NpYmxlIG9uIHRoZSBgZGVlcC1kaXZlYCBbZ2Vub21pYyByZXNvdXJjZXMgcGFnZV0oaHR0cHM6Ly9naXRodWIuY29tL3Vyb2wtZTUvZGVlcC1kaXZlL3dpa2kvU3BlY2llcy1DaGFyYWN0ZXJpc3RpY3MtYW5kLUdlbm9taWMtUmVzb3VyY2VzI2dlbm9taWMtcmVzb3VyY2VzKS4KCmBgYHtyIGRvd25sb2FkLXRyYW5zY3JpcHRvbWUsIGVuZ2luZT0nYmFzaCd9CmN1cmwgaHR0cHM6Ly9nYW5uZXQuZmlzaC53YXNoaW5ndG9uLmVkdS9hY3JvcG9yYS9FNS1kZWVwLWRpdmUvVHJhbnNjcmlwdHMvUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEuZ2VuZXMuY2RzLmZuYSBcCi1rIFwKPiAuLi8uLi9kYXRhL1BvY2lsbG9wb3JhX21lYW5kcmluYV9ISXYxLmdlbmVzLmNkcy5mbmEKYGBgCgpMZXQncyBjaGVjayB0aGUgZmlsZQoKYGBge3IgdHJhbnNjcmlwdG9tZS12aWV3LXF1ZXJ5LCBlbmdpbmU9J2Jhc2gnLCBldmFsPVRSVUV9CmVjaG8gIkZpcnN0IGZldyBsaW5lczoiCmhlYWQgLTMgLi4vLi4vZGF0YS9Qb2NpbGxvcG9yYV9tZWFuZHJpbmFfSEl2MS5nZW5lcy5jZHMuZm5hCgplY2hvICIiCmVjaG8gIkhvdyBtYW55IHNlcXVlbmNlcyBhcmUgdGhlcmU/IgpncmVwIC1jICI+IiAuLi8uLi9kYXRhL1BvY2lsbG9wb3JhX21lYW5kcmluYV9ISXYxLmdlbmVzLmNkcy5mbmEKYGBgCgoKYGBge3IgdHJhbnNjcmlwdG9tZS1zZXFsZW5ndGgtaGlzdG9ncmFtLCBldmFsPVRSVUV9CiMgUmVhZCBGQVNUQSBmaWxlCmZhc3RhX2ZpbGUgPC0gIi4uLy4uL2RhdGEvUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEuZ2VuZXMuY2RzLmZuYSIgICMgUmVwbGFjZSB3aXRoIHRoZSBuYW1lIG9mIHlvdXIgRkFTVEEgZmlsZQpzZXF1ZW5jZXMgPC0gcmVhZEROQVN0cmluZ1NldChmYXN0YV9maWxlKQoKIyBDYWxjdWxhdGUgc2VxdWVuY2UgbGVuZ3RocwpzZXF1ZW5jZV9sZW5ndGhzIDwtIHdpZHRoKHNlcXVlbmNlcykKCiMgQ3JlYXRlIGEgZGF0YSBmcmFtZQpzZXF1ZW5jZV9sZW5ndGhzX2RmIDwtIGRhdGEuZnJhbWUoTGVuZ3RoID0gc2VxdWVuY2VfbGVuZ3RocykKCiMgUGxvdCBoaXN0b2dyYW0gdXNpbmcgZ2dwbG90MgpnZ3Bsb3Qoc2VxdWVuY2VfbGVuZ3Roc19kZiwgYWVzKHggPSBMZW5ndGgpKSArCiAgZ2VvbV9oaXN0b2dyYW0oYmlud2lkdGggPSAxLCBjb2xvciA9ICJibGFjayIsIGZpbGwgPSAiYmx1ZSIsIGFscGhhID0gMC43NSkgKwogIGxhYnModGl0bGUgPSAiSGlzdG9ncmFtIG9mIFNlcXVlbmNlIExlbmd0aHMiLAogICAgICAgeCA9ICJTZXF1ZW5jZSBMZW5ndGgiLAogICAgICAgeSA9ICJGcmVxdWVuY3kiKSArCiAgdGhlbWVfbWluaW1hbCgpCgpzdW1tYXJ5KHNlcXVlbmNlX2xlbmd0aHNfZGYpCmBgYAoKYGBge3IgdHJhbnNjcmlwdG9tZS1BQ0dULWNvbXBvc2l0aW9uLCBldmFsPVRSVUV9CgojIENhbGN1bGF0ZSBiYXNlIGNvbXBvc2l0aW9uCmJhc2VfY29tcG9zaXRpb24gPC0gYWxwaGFiZXRGcmVxdWVuY3koc2VxdWVuY2VzLCBiYXNlT25seSA9IFRSVUUpCgojIENvbnZlcnQgdG8gZGF0YSBmcmFtZSBhbmQgcmVzaGFwZSBmb3IgZ2dwbG90MgpiYXNlX2NvbXBvc2l0aW9uX2RmIDwtIGFzLmRhdGEuZnJhbWUoYmFzZV9jb21wb3NpdGlvbikKYmFzZV9jb21wb3NpdGlvbl9kZiRJRCA8LSByb3duYW1lcyhiYXNlX2NvbXBvc2l0aW9uX2RmKQpiYXNlX2NvbXBvc2l0aW9uX21lbHRlZCA8LSByZXNoYXBlMjo6bWVsdChiYXNlX2NvbXBvc2l0aW9uX2RmLCBpZC52YXJzID0gIklEIiwgdmFyaWFibGUubmFtZSA9ICJCYXNlIiwgdmFsdWUubmFtZSA9ICJDb3VudCIpCgojIFBsb3QgYmFzZSBjb21wb3NpdGlvbiBiYXIgY2hhcnQgdXNpbmcgZ2dwbG90MgpnZ3Bsb3QoYmFzZV9jb21wb3NpdGlvbl9tZWx0ZWQsIGFlcyh4ID0gQmFzZSwgeSA9IENvdW50LCBmaWxsID0gQmFzZSkpICsKICBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgcG9zaXRpb24gPSAiZG9kZ2UiLCBjb2xvciA9ICJibGFjayIpICsKICBsYWJzKHRpdGxlID0gIkJhc2UgQ29tcG9zaXRpb24iLAogICAgICAgeCA9ICJCYXNlIiwKICAgICAgIHkgPSAiQ291bnQiKSArCiAgdGhlbWVfbWluaW1hbCgpICsKICBzY2FsZV9maWxsX21hbnVhbCh2YWx1ZXMgPSBjKCJBIiA9ICJncmVlbiIsICJDIiA9ICJibHVlIiwgIkciID0gInllbGxvdyIsICJUIiA9ICJyZWQiKSkKYGBgCgoKYGBge3IgdHJhbnNjcmlwdG9tZS1jZy1tb3RpZnMsIGV2YWw9VFJVRX0KCiMgQ291bnQgQ0cgbW90aWZzIGluIGVhY2ggc2VxdWVuY2UKY291bnRfY2dfbW90aWZzIDwtIGZ1bmN0aW9uKHNlcXVlbmNlKSB7CiAgY2dfbW90aWYgPC0gIkNHIgogIHJldHVybihsZW5ndGgoZ3JlZ2V4cHIoY2dfbW90aWYsIHNlcXVlbmNlLCBmaXhlZCA9IFRSVUUpW1sxXV0pKQp9CgpjZ19tb3RpZnNfY291bnRzIDwtIHNhcHBseShzZXF1ZW5jZXMsIGNvdW50X2NnX21vdGlmcykKCiMgQ3JlYXRlIGEgZGF0YSBmcmFtZQpjZ19tb3RpZnNfY291bnRzX2RmIDwtIGRhdGEuZnJhbWUoQ0dfQ291bnQgPSBjZ19tb3RpZnNfY291bnRzKQoKIyBQbG90IENHIG1vdGlmcyBkaXN0cmlidXRpb24gdXNpbmcgZ2dwbG90MgpnZ3Bsb3QoY2dfbW90aWZzX2NvdW50c19kZiwgYWVzKHggPSBDR19Db3VudCkpICsKICBnZW9tX2hpc3RvZ3JhbShiaW53aWR0aCA9IDEsIGNvbG9yID0gImJsYWNrIiwgZmlsbCA9ICJibHVlIiwgYWxwaGEgPSAwLjc1KSArCiAgbGFicyh0aXRsZSA9ICJEaXN0cmlidXRpb24gb2YgQ0cgTW90aWZzIiwKICAgICAgIHggPSAiTnVtYmVyIG9mIENHIE1vdGlmcyIsCiAgICAgICB5ID0gIkZyZXF1ZW5jeSIpICsKICB0aGVtZV9taW5pbWFsKCkKYGBgCgojIyBEYXRhYmFzZSBDcmVhdGlvbgoKIyMjIE9idGFpbiBGYXN0YSAoVW5pUHJvdC9Td2lzcy1Qcm90KQoKYGBge3IgZG93bmxvYWQtVW5pUFN3aXNzUC1kYXRhLCBlbmdpbmU9J2Jhc2gnfQpjZCAuLi8uLi9kYXRhCmN1cmwgLU8gaHR0cHM6Ly9mdHAudW5pcHJvdC5vcmcvcHViL2RhdGFiYXNlcy91bmlwcm90L2N1cnJlbnRfcmVsZWFzZS9rbm93bGVkZ2ViYXNlL2NvbXBsZXRlL3VuaXByb3Rfc3Byb3QuZmFzdGEuZ3oKbXYgdW5pcHJvdF9zcHJvdC5mYXN0YS5neiB1bmlwcm90X3Nwcm90X3IyMDIzXzA0LmZhc3RhLmd6Cmd1bnppcCAtayB1bmlwcm90X3Nwcm90X3IyMDIzXzA0LmZhc3RhLmd6CmBgYAoKIyMjIE1ha2luZyB0aGUgZGF0YWJhc2UKCmBgYHtyIG1ha2UtVW5pUFN3aXNzUC1ibGFzdGRiLCBlbmdpbmU9J2Jhc2gnfQovaG9tZS9zaGFyZWQvbmNiaS1ibGFzdC0yLjExLjArL2Jpbi9tYWtlYmxhc3RkYiBcCi1pbiAuLi8uLi9kYXRhL3VuaXByb3Rfc3Byb3RfcjIwMjNfMDQuZmFzdGEgXAotZGJ0eXBlIHByb3QgXAotb3V0IC4uLy4uL2JsYXN0ZGIvdW5pcHJvdF9zcHJvdF9yMjAyM18wNApgYGAKCgojIyBSdW5uaW5nIEJsYXN0eAoKYGBge3IgdHJhbnNjcmlwdG9tZS1ibGFzdHgsIGVuZ2luZT0nYmFzaCd9Ci9ob21lL3NoYXJlZC9uY2JpLWJsYXN0LTIuMTEuMCsvYmluL2JsYXN0eCBcCi1xdWVyeSAuLi8uLi9kYXRhL1BvY2lsbG9wb3JhX21lYW5kcmluYV9ISXYxLmdlbmVzLmNkcy5mbmEgXAotZGIgLi4vLi4vYmxhc3RkYi91bmlwcm90X3Nwcm90X3IyMDIzXzA0IFwKLW91dCAuLi9vdXRwdXQvMDItUHR1aC1yZWZlcmVuY2UtYW5ub3RhdGlvbi9Qb2NpbGxvcG9yYV9tZWFuZHJpbmFfSEl2MS11bmlwcm90X2JsYXN0eC50YWIgXAotZXZhbHVlIDFFLTIwIFwKLW51bV90aHJlYWRzIDQwIFwKLW1heF90YXJnZXRfc2VxcyAxIFwKLW91dGZtdCA2CmBgYAoKYGBge3IgdHJhbnNjcmlwdG9tZS1ibGFzdC1sb29rLCBlbmdpbmU9J2Jhc2gnLCBldmFsPVRSVUV9CmVjaG8gIkZpcnN0IGZldyBsaW5lczoiCmhlYWQgLTIgLi4vb3V0cHV0LzAyLVB0dWgtcmVmZXJlbmNlLWFubm90YXRpb24vUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEtdW5pcHJvdF9ibGFzdHgudGFiCgplY2hvICJOdW1iZXIgb2YgbGluZXMgaW4gb3V0cHV0OiIKd2MgLWwgLi4vb3V0cHV0LzAyLVB0dWgtcmVmZXJlbmNlLWFubm90YXRpb24vUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEtdW5pcHJvdF9ibGFzdHgudGFiCmBgYAoKCiMjIEpvaW5pbmcgQmxhc3QgdGFibGUgd2l0aCBhbm5vYXRpb25zLgoKIyMjIFByZXBwaW5nIEJsYXN0IHRhYmxlIGZvciBlYXN5IGpvaW4KCmBgYHtyIHRyYW5zY3JpcHRvbWUtc2VwYXJhdGUsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0KdHIgJ3wnICdcdCcgPCAuLi9vdXRwdXQvMDItUHR1aC1yZWZlcmVuY2UtYW5ub3RhdGlvbi9Qb2NpbGxvcG9yYV9tZWFuZHJpbmFfSEl2MS11bmlwcm90X2JsYXN0eC50YWIgXAo+IC4uL291dHB1dC8wMi1QdHVoLXJlZmVyZW5jZS1hbm5vdGF0aW9uL1BvY2lsbG9wb3JhX21lYW5kcmluYV9ISXYxLXVuaXByb3RfYmxhc3R4X3NlcC50YWIKCmhlYWQgLTEgLi4vb3V0cHV0LzAyLVB0dWgtcmVmZXJlbmNlLWFubm90YXRpb24vUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEtdW5pcHJvdF9ibGFzdHhfc2VwLnRhYgoKYGBgCgojIyMgQ291bGQgZG8gc29tZSBjb29sIHN0dWZmIGluIFIgaGVyZSByZWFkaW5nIGluIHRhYmxlCgpgYGB7ciB0cmFuc2NyaXB0b21lLXJlYWQtZGF0YSwgZXZhbD1UUlVFLCBjYWNoZT1UUlVFfQpibHRhYmwgPC0gcmVhZC5jc3YoIi4uL291dHB1dC8wMi1QdHVoLXJlZmVyZW5jZS1hbm5vdGF0aW9uL1BvY2lsbG9wb3JhX21lYW5kcmluYV9ISXYxLXVuaXByb3RfYmxhc3R4X3NlcC50YWIiLCBzZXAgPSAnXHQnLCBoZWFkZXIgPSBGQUxTRSkKCnNwZ28gPC0gcmVhZC5jc3YoImh0dHBzOi8vZ2FubmV0LmZpc2gud2FzaGluZ3Rvbi5lZHUvc2Vhc2hlbGwvc25hcHMvdW5pcHJvdF90YWJsZV9yMjAyM18wMS50YWIiLCBzZXAgPSAnXHQnLCBoZWFkZXIgPSBUUlVFKQoKZGF0YXRhYmxlKGhlYWQoYmx0YWJsKSwgb3B0aW9ucyA9IGxpc3Qoc2Nyb2xsWCA9IFRSVUUsIHNjcm9sbFkgPSAiNDAwcHgiLCBzY3JvbGxDb2xsYXBzZSA9IFRSVUUsIHBhZ2luZyA9IEZBTFNFKSkKYGBgCgpgYGB7ciB0cmFuc2NyaXB0b21lLXNwZ28tdGFibGUsIGV2YWw9VFJVRX0KZGF0YXRhYmxlKGhlYWQoc3BnbyksIG9wdGlvbnMgPSBsaXN0KHNjcm9sbFggPSBUUlVFLCBzY3JvbGxZID0gIjQwMHB4Iiwgc2Nyb2xsQ29sbGFwc2UgPSBUUlVFLCBwYWdpbmcgPSBGQUxTRSkpCmBgYAoKYGBge3IgdHJhbnNjcmlwdG9tZS1zZWUsIGV2YWw9VFJVRX0KZGF0YXRhYmxlKAogIGxlZnRfam9pbihibHRhYmwsIHNwZ28sICBieSA9IGMoIlYzIiA9ICJFbnRyeSIpKSAlPiUKICBzZWxlY3QoVjEsIFYzLCBWMTMsIFByb3RlaW4ubmFtZXMsIE9yZ2FuaXNtLCBHZW5lLk9udG9sb2d5Li5iaW9sb2dpY2FsLnByb2Nlc3MuLCBHZW5lLk9udG9sb2d5LklEcykKKQpgYGAKCmBgYHtyIHRyYW5zY3JpcHRvbWUtam9pbiwgZXZhbD1UUlVFfQphbm5vdF90YWIgPC0KICBsZWZ0X2pvaW4oYmx0YWJsLCBzcGdvLCAgYnkgPSBjKCJWMyIgPSAiRW50cnkiKSkgJT4lCiAgc2VsZWN0KFYxLCBWMywgVjEzLCBQcm90ZWluLm5hbWVzLCBPcmdhbmlzbSwgR2VuZS5PbnRvbG9neS4uYmlvbG9naWNhbC5wcm9jZXNzLiwgR2VuZS5PbnRvbG9neS5JRHMpCgp3cml0ZS50YWJsZShhbm5vdF90YWIsIGZpbGUgPSAiLi4vb3V0cHV0LzAyLVB0dWgtcmVmZXJlbmNlLWFubm90YXRpb24vUG9jaWxsb3BvcmFfbWVhbmRyaW5hX0hJdjEtSURtYXBwaW5nLTIwMjRfMDlfMDQudGFiIiwgc2VwID0gIlx0IiwKICAgICAgICAgICAgcm93Lm5hbWVzID0gVFJVRSwgY29sLm5hbWVzID0gTkEpCmBgYAoKYGBge3IgdHJhbnNjcmlwdG9tZS12aWV3LWhlYWRlcnMsIGVuZ2luZT0nYmFzaCd9CmhlYWQgLW4gMyAuLi9vdXRwdXQvMDItUHR1aC1yZWZlcmVuY2UtYW5ub3RhdGlvbi9Qb2NpbGxvcG9yYV9tZWFuZHJpbmFfSEl2MS1JRG1hcHBpbmctMjAyNF8wOV8wNC50YWIKYGBgCgpgYGB7ciB0cmFuc2NyaXB0b21lLXNwZWNpZXMtaGl0cywgZXZhbD1UUlVFfQojIFJlYWQgZGF0YXNldAojZGF0YXNldCA8LSByZWFkLmNzdigiLi4vb3V0cHV0L2JsYXN0X2Fubm90X2dvLnRhYiIsIHNlcCA9ICdcdCcpICAjIFJlcGxhY2Ugd2l0aCB0aGUgcGF0aCB0byB5b3VyIGRhdGFzZXQKCiMgU2VsZWN0IHRoZSBjb2x1bW4gb2YgaW50ZXJlc3QKY29sdW1uX25hbWUgPC0gIk9yZ2FuaXNtIiAgIyBSZXBsYWNlIHdpdGggdGhlIG5hbWUgb2YgdGhlIGNvbHVtbiBvZiBpbnRlcmVzdApjb2x1bW5fZGF0YSA8LSBhbm5vdF90YWJbW2NvbHVtbl9uYW1lXV0KCiMgQ291bnQgdGhlIG9jY3VycmVuY2VzIG9mIHRoZSBzdHJpbmdzIGluIHRoZSBjb2x1bW4Kc3RyaW5nX2NvdW50cyA8LSB0YWJsZShjb2x1bW5fZGF0YSkKCiMgQ29udmVydCB0byBhIGRhdGEgZnJhbWUsIHNvcnQgYnkgY291bnQsIGFuZCBzZWxlY3QgdGhlIHRvcCAxMApzdHJpbmdfY291bnRzX2RmIDwtIGFzLmRhdGEuZnJhbWUoc3RyaW5nX2NvdW50cykKY29sbmFtZXMoc3RyaW5nX2NvdW50c19kZikgPC0gYygiU3RyaW5nIiwgIkNvdW50IikKc3RyaW5nX2NvdW50c19kZiA8LSBzdHJpbmdfY291bnRzX2RmW29yZGVyKHN0cmluZ19jb3VudHNfZGYkQ291bnQsIGRlY3JlYXNpbmcgPSBUUlVFKSwgXQp0b3BfMTBfc3RyaW5ncyA8LSBoZWFkKHN0cmluZ19jb3VudHNfZGYsIG4gPSAxMCkKCiMgUGxvdCB0aGUgdG9wIDEwIG1vc3QgY29tbW9uIHN0cmluZ3MgdXNpbmcgZ2dwbG90MgpnZ3Bsb3QodG9wXzEwX3N0cmluZ3MsIGFlcyh4ID0gcmVvcmRlcihTdHJpbmcsIC1Db3VudCksIHkgPSBDb3VudCwgZmlsbCA9IFN0cmluZykpICsKICBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgcG9zaXRpb24gPSAiZG9kZ2UiLCBjb2xvciA9ICJibGFjayIpICsKICBsYWJzKHRpdGxlID0gIlRvcCAxMCBTcGVjaWVzIGhpdHMiLAogICAgICAgeCA9IGNvbHVtbl9uYW1lLAogICAgICAgeSA9ICJDb3VudCIpICsKICB0aGVtZV9taW5pbWFsKCkgKwogIHRoZW1lKGxlZ2VuZC5wb3NpdGlvbiA9ICJub25lIikgKwogIGNvb3JkX2ZsaXAoKQpgYGAKCmBgYHtyIHRyYW5zY3JpcHRvbWUtdG9wLWdvLCBldmFsPVRSVUV9CgojZGF0YSA8LSByZWFkLmNzdigiLi4vb3V0cHV0L2JsYXN0X2Fubm90X2dvLnRhYiIsIHNlcCA9ICdcdCcpCgojIFJlbmFtZSB0aGUgYEdlbmUuT250b2xvZ3kuLmJpb2xvZ2ljYWwucHJvY2Vzcy5gIGNvbHVtbiB0byBgQmlvbG9naWNhbF9Qcm9jZXNzYApjb2xuYW1lcyhhbm5vdF90YWIpW2NvbG5hbWVzKGFubm90X3RhYikgPT0gIkdlbmUuT250b2xvZ3kuLmJpb2xvZ2ljYWwucHJvY2Vzcy4iXSA8LSAiQmlvbG9naWNhbF9Qcm9jZXNzIgoKIyBTZXBhcmF0ZSB0aGUgYEJpb2xvZ2ljYWxfUHJvY2Vzc2AgY29sdW1uIGludG8gaW5kaXZpZHVhbCBiaW9sb2dpY2FsIHByb2Nlc3NlcwpkYXRhX3NlcGFyYXRlZCA8LSB1bmxpc3Qoc3Ryc3BsaXQoYW5ub3RfdGFiJEJpb2xvZ2ljYWxfUHJvY2Vzcywgc3BsaXQgPSAiOyIpKQoKIyBUcmltIHdoaXRlc3BhY2UgZnJvbSB0aGUgYmlvbG9naWNhbCBwcm9jZXNzZXMKZGF0YV9zZXBhcmF0ZWQgPC0gZ3N1YigiXlxccyt8XFxzKyQiLCAiIiwgZGF0YV9zZXBhcmF0ZWQpCgojIENvdW50IHRoZSBvY2N1cnJlbmNlcyBvZiBlYWNoIGJpb2xvZ2ljYWwgcHJvY2Vzcwpwcm9jZXNzX2NvdW50cyA8LSB0YWJsZShkYXRhX3NlcGFyYXRlZCkKcHJvY2Vzc19jb3VudHMgPC0gZGF0YS5mcmFtZShCaW9sb2dpY2FsX1Byb2Nlc3MgPSBuYW1lcyhwcm9jZXNzX2NvdW50cyksIENvdW50ID0gYXMuaW50ZWdlcihwcm9jZXNzX2NvdW50cykpCnByb2Nlc3NfY291bnRzIDwtIHByb2Nlc3NfY291bnRzW29yZGVyKC1wcm9jZXNzX2NvdW50cyRDb3VudCksIF0KCiMgU2VsZWN0IHRoZSAyMCBtb3N0IHByZWRvbWluYW50IGJpb2xvZ2ljYWwgcHJvY2Vzc2VzCnRvcF8yMF9wcm9jZXNzZXMgPC0gcHJvY2Vzc19jb3VudHNbMToyMCwgXQoKIyBDcmVhdGUgYSBjb2xvciBwYWxldHRlIGZvciB0aGUgYmFycwpiYXJfY29sb3JzIDwtIHJhaW5ib3cobnJvdyh0b3BfMjBfcHJvY2Vzc2VzKSkKCiMgQ3JlYXRlIGEgc3RhZ2dlcmVkIHZlcnRpY2FsIGJhciBwbG90IHdpdGggZGlmZmVyZW50IGNvbG9ycyBmb3IgZWFjaCBiYXIKYmFycGxvdCh0b3BfMjBfcHJvY2Vzc2VzJENvdW50LCBuYW1lcy5hcmcgPSByZXAoIiIsIG5yb3codG9wXzIwX3Byb2Nlc3NlcykpLCBjb2wgPSBiYXJfY29sb3JzLAogICAgICAgIHlsaW0gPSBjKDAsIG1heCh0b3BfMjBfcHJvY2Vzc2VzJENvdW50KSAqIDEuMjUpLAogICAgICAgIG1haW4gPSAiT2NjdXJyZW5jZXMgb2YgdGhlIDIwIE1vc3QgUHJlZG9taW5hbnQgQmlvbG9naWNhbCBQcm9jZXNzZXMiLCB4bGFiID0gIkJpb2xvZ2ljYWwgUHJvY2VzcyIsIHlsYWIgPSAiQ291bnQiKQoKCiMgQ3JlYXRlIGEgc2VwYXJhdGUgcGxvdCBmb3IgdGhlIGxlZ2VuZApwbmcoIi4uL291dHB1dC8wMi1QdHVoLXJlZmVyZW5jZS1hbm5vdGF0aW9uL0dPbGVnZW5kLnBuZyIsIHdpZHRoID0gODAwLCBoZWlnaHQgPSA2MDApCnBhcihtYXIgPSBjKDAsIDAsIDAsIDApKQpwbG90Lm5ldygpCmxlZ2VuZCgiY2VudGVyIiwgbGVnZW5kID0gdG9wXzIwX3Byb2Nlc3NlcyRCaW9sb2dpY2FsX1Byb2Nlc3MsIGZpbGwgPSBiYXJfY29sb3JzLCBjZXggPSAxLCB0aXRsZSA9ICJCaW9sb2dpY2FsIFByb2Nlc3NlcyIpCmRldi5vZmYoKQpgYGAKCmBgYHtyIHRyYW5zY3JpcHRvbWUtZ28tbGVnZW5kLCBldmFsPVRSVUUsIGZpZy53aWR0aCA9IDEwMCAsZmlnLmhlaWdodCA9IDEwMH0Ka25pdHI6OmluY2x1ZGVfZ3JhcGhpY3MoIi4uL291dHB1dC8wMi1QdHVoLXJlZmVyZW5jZS1hbm5vdGF0aW9uL0dPbGVnZW5kLnBuZyIpCmBgYAoKYGBge3IgdHJhbnNjcmlwdG9tZS1yZW1vdmUtbGVnZW5kLWZpbGUsIGVuZ2luZT0nYmFzaCcsIGV2YWw9VFJVRX0Kcm0gLi4vb3V0cHV0LzAyLVB0dWgtcmVmZXJlbmNlLWFubm90YXRpb24vR09sZWdlbmQucG5nCmBgYA==

02-Ptuh-reference-annotation

Kathleen Durkin

2024-09-04