2023-04-25

Minimum Required components

  • ☒ Show core code
  • ☒ Show parts of initial data (could be first few lines etc)
  • ☐ Include a table
  • ☐ Include image
  • ☒ Include plot generated from code
  • ☐ Highlight specific lines of code in code block

Project Goals

  • ☐ annotate geoduck transcriptome
  • ☐ annotate geoduck tissue transcriptome (gonad, ctenidia, heart, juvenile, larvae)
  • ☐ add comparative species analysis with Mercenaria and Manila transcriptomes against geoduck transcriptome

What is a Geoduck?

Raw tpm data
target_id gene ctenidia gonad heart juvenile larvae
PGEN_.00g000010 PGEN_.00g000010 0.000000 0.000000 0.000000 4.851851 3.423667
PGEN_.00g000020 PGEN_.00g000020 0.000000 0.000000 0.000000 0.840164 0.370266
PGEN_.00g000030 PGEN_.00g000030 0.225494 0.000000 0.000000 0.069598 0.052545
PGEN_.00g000040 PGEN_.00g000040 0.565506 0.000000 0.254843 0.376364 1.131114
PGEN_.00g000050 PGEN_.00g000050 0.508251 4.745168 0.228272 0.182728 1.117655

download other clam species

Manila db blast result
gene Scaffold Manila_gene V3 V4 V5 V6 V7 V8 V9 V10 e-value V12 accessions gene_id gene_name gene_description alt_gene_description all_GO_ids BP_GO_ids CC_GO_ids MF_GO_ids GOslim Term
PGEN_.00g000300 Scaffold_01:503707-557915 AM873085.1 80.745 161 25 6 1902 2058 608 450 0 121 Q5REG4 100171717 DTX3 Probable E3 ubiquitin-protein ligase DTX3 RING-type E3 ubiquitin transferase DTX3 GO:0005737;GO:0046872;GO:0016740;GO:0007219;GO:0016567 GO:0007219;GO:0016567 GO:0005737 GO:0046872;GO:0016740 GO:0023052 signaling
PGEN_.00g000970 Scaffold_01:1970367-1991359 JO122367.1 85.217 115 16 1 17344 17458 221 108 0 117 P55096 19299 Abcd3 ATP-binding cassette sub-family D member 3 70 kDa peroxisomal membrane protein GO:0016021;GO:0043231;GO:0005743;GO:0005739;GO:0005782;GO:0005778;GO:0005777;GO:0140359;GO:0047617;GO:0005524;GO:0016887;GO:0042626;GO:0005324;GO:0042803;GO:0043621;GO:0015721;GO:0006699;GO:0006635;GO:0006633;GO:0006869;GO:0015910;GO:0007031;GO:1903512;GO:0014070;GO:0009410;GO:0042760;GO:0000038 GO:0015721;GO:0006699;GO:0006635;GO:0006633;GO:0006869;GO:0015910;GO:0007031;GO:1903512;GO:0014070;GO:0009410;GO:0042760;GO:0000038 GO:0016021;GO:0043231;GO:0005743;GO:0005739;GO:0005782;GO:0005778;GO:0005777 GO:0140359;GO:0047617;GO:0005524;GO:0016887;GO:0042626;GO:0005324;GO:0042803;GO:0043621 GO:0006629;GO:0006629;GO:0006629;GO:0055085;GO:0006629;GO:0006629;GO:0006629 lipid metabolic process;lipid metabolic process;lipid metabolic process;transmembrane transport;lipid metabolic process;lipid metabolic process;lipid metabolic process
PGEN_.00g001730 Scaffold_01:3585240-3594053 AM877583.1 80.531 226 36 6 1 222 82 303 0 167 Q8NC51;Q5VU19;Q5VU20;Q5VU22;Q8WUH0;Q96SE2;Q9BTY3;Q9BUM4;Q9Y367Q9Y4S3 26135 SERBP1 Plasminogen activator inhibitor 1 RNA-binding protein SERPINE1 mRNA-binding protein 1 GO:0005737;GO:0005829;GO:0070062;GO:0016020;GO:0005634;GO:0048471;GO:0045296;GO:0003730;GO:0043022;GO:0003723;GO:0032183;GO:0030578;GO:0043488 GO:0030578;GO:0043488 GO:0005737;GO:0005829;GO:0070062;GO:0016020;GO:0005634;GO:0048471 GO:0045296;GO:0003730;GO:0043022;GO:0003723;GO:0032183 GO:0016071 mRNA metabolic process
PGEN_.00g002420 Scaffold_01:5732605-5754981 JO108664.1 88.722 133 15 0 9741 9873 8 140 0 163 P56520 395506 HDAC3 Histone deacetylase 3 Protein deacylase HDAC3 GO:0005737;GO:0000118;GO:0005634;GO:0017053;GO:0003682;GO:0140297;GO:0004407;GO:0032041;GO:0003714;GO:0006325;GO:0032922;GO:0070932;GO:0070933;GO:0000122;GO:0045944;GO:0042752 GO:0006325;GO:0032922;GO:0070932;GO:0070933;GO:0000122;GO:0045944;GO:0042752 GO:0005737;GO:0000118;GO:0005634;GO:0017053 GO:0003682;GO:0140297;GO:0004407;GO:0032041;GO:0003714 GO:0006351;GO:0006355;GO:0006351;GO:0006355 DNA-templated transcription;regulation of DNA-templated transcription;DNA-templated transcription;regulation of DNA-templated transcription
PGEN_.00g002430 Scaffold_01:5761729-5830003 JO102954.1 93.396 106 7 0 5709 5814 148 253 0 158 Q6AY22 362056 Spata1 Spermatogenesis-associated protein 1 Protein deacylase HDAC3 NA NA
PGEN_.00g002480 Scaffold_01:5933156-5984637 JO119744.1 84.000 125 20 0 22342 22466 656 780 0 121 Q8BFY9;Q8C0S3;Q8K2E7 238799 Tnpo1 Transportin-1 Karyopherin beta-2 GO:0005737;GO:0005634;GO:0061608;GO:0008139;GO:0031267;GO:0006606 GO:0006606 GO:0005737;GO:0005634 GO:0061608;GO:0008139;GO:0031267 GO:0006886;GO:0006913 intracellular protein transport;nucleocytoplasmic transport
##         target_id            gene ctenidia    gonad    heart juvenile   larvae
## 1 PGEN_.00g000010 PGEN_.00g000010 0.000000 0.000000 0.000000 4.851851 3.423667
## 2 PGEN_.00g000020 PGEN_.00g000020 0.000000 0.000000 0.000000 0.840164 0.370266
## 3 PGEN_.00g000030 PGEN_.00g000030 0.225494 0.000000 0.000000 0.069598 0.052545
## 4 PGEN_.00g000040 PGEN_.00g000040 0.565506 0.000000 0.254843 0.376364 1.131114
## 5 PGEN_.00g000050 PGEN_.00g000050 0.508251 4.745168 0.228272 0.182728 1.117655
## 6 PGEN_.00g000060 PGEN_.00g000060 6.490179 0.000000 0.000000 6.742646 5.936612
##         target_id            gene   tissue      tpm
## 1 PGEN_.00g000010 PGEN_.00g000010 ctenidia 0.000000
## 2 PGEN_.00g000020 PGEN_.00g000020 ctenidia 0.000000
## 3 PGEN_.00g000030 PGEN_.00g000030 ctenidia 0.225494
## 4 PGEN_.00g000040 PGEN_.00g000040 ctenidia 0.565506
## 5 PGEN_.00g000050 PGEN_.00g000050 ctenidia 0.508251
## 6 PGEN_.00g000060 PGEN_.00g000060 ctenidia 6.490179

combine datasets into one gene annotation file

pgenerosa_simple_goslims<-salmonMatrix %>% #best pgenerosa data set
  left_join(goslims, by=c("gene"))
pgenerosa_long<-tidy_data_long %>% #best long pgenerosa data set
  left_join(goslims, by=c("gene"))
pgenerosa_goslims_long<-tidy_data_long %>%
  left_join(pgenerosa_simple_goslims, by=c("gene"))

head(pgenerosa_simple_goslims)
##         target_id            gene ctenidia    gonad    heart juvenile   larvae
## 1 PGEN_.00g000010 PGEN_.00g000010 0.000000 0.000000 0.000000 4.851851 3.423667
## 2 PGEN_.00g000020 PGEN_.00g000020 0.000000 0.000000 0.000000 0.840164 0.370266
## 3 PGEN_.00g000030 PGEN_.00g000030 0.225494 0.000000 0.000000 0.069598 0.052545
## 4 PGEN_.00g000040 PGEN_.00g000040 0.565506 0.000000 0.254843 0.376364 1.131114
## 5 PGEN_.00g000050 PGEN_.00g000050 0.508251 4.745168 0.228272 0.182728 1.117655
## 6 PGEN_.00g000060 PGEN_.00g000060 6.490179 0.000000 0.000000 6.742646 5.936612
##                                                    accessions gene_id gene_name
## 1                                               Q86IC9;Q552T5 8620183      omt5
## 2                                                      P04177   25085        Th
## 3                                                        <NA>      NA      <NA>
## 4                                                        <NA>      NA      <NA>
## 5                                        Q8L840;O04092;Q9FT71  837636   RECQL4A
## 6 Q61043;A0A1Y7VJL5;B2RQ73;B7ZMZ9;E9Q488;E9Q4S3;Q674R4;Q6ZPM7   18080       Nin
##                              gene_description   alt_gene_description
## 1 Probable caffeoyl-CoA O-methyltransferase 1  O-methyltransferase 5
## 2                    Tyrosine 3-monooxygenase Tyrosine 3-hydroxylase
## 3                                        <NA>                   <NA>
## 4                                        <NA>                   <NA>
## 5        ATP-dependent DNA helicase Q-like 4A      SGS1-like protein
## 6                                      Ninein      SGS1-like protein
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       all_GO_ids
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    GO:0042409;GO:0046872;GO:0008757;GO:0032259
## 2 GO:0030424;GO:0005737;GO:0009898;GO:0031410;GO:0030659;GO:0005829;GO:0030425;GO:0033162;GO:0005739;GO:0043005;GO:0043025;GO:0005634;GO:0043204;GO:0048471;GO:0005790;GO:0008021;GO:0043195;GO:0016597;GO:0035240;GO:0019899;GO:0008199;GO:0008198;GO:0042802;GO:0004497;GO:0019825;GO:0019904;GO:0034617;GO:0004511;GO:0015842;GO:0009887;GO:0042423;GO:0071312;GO:0071333;GO:0071363;GO:0071287;GO:0071316;GO:0071466;GO:0021987;GO:0042745;GO:0050890;GO:0042416;GO:0006585;GO:0042755;GO:0048596;GO:0042418;GO:0042462;GO:0006631;GO:0016137;GO:0007507;GO:1990384;GO:0033076;GO:0007612;GO:0007626;GO:0007617;GO:0007613;GO:0010259;GO:0042136;GO:0042421;GO:0018963;GO:0052314;GO:0008016;GO:0014823;GO:0001975;GO:0051412;GO:0051602;GO:0032355;GO:0045471;GO:0045472;GO:0070848;GO:0009635;GO:0001666;GO:0035902;GO:0017085;GO:0035900;GO:0009416;GO:0032496;GO:0010038;GO:0035094;GO:0031667;GO:0014070;GO:0043434;GO:0046684;GO:0009651;GO:0048545;GO:0009414;GO:0009410;GO:0010043;GO:0007605;GO:0035176;GO:0006665;GO:0001963;GO:0042214;GO:0007601
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           <NA>
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           <NA>
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               GO:0005694;GO:0005737;GO:0005634;GO:0009506;GO:0043138;GO:0005524;GO:0016887;GO:0009378;GO:0046872;GO:0003676;GO:0071215;GO:0070417;GO:0006974;GO:0051276;GO:0032508;GO:0006310;GO:0006281;GO:0006268;GO:0000724
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      GO:0045177;GO:0030424;GO:0044295;GO:0120103;GO:0005814;GO:0005813;GO:0097539;GO:0005881;GO:0030425;GO:0072686;GO:0097431;GO:0005730;GO:0005654;GO:0000242;GO:0005886;GO:0000922;GO:0005509;GO:0005525;GO:0019900;GO:0051011;GO:0010457;GO:0051642;GO:0090222;GO:0048668;GO:0021540;GO:0021957;GO:0034454;GO:0050772;GO:0031116;GO:0008104
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    BP_GO_ids
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 GO:0032259
## 2 GO:0015842;GO:0009887;GO:0042423;GO:0071312;GO:0071333;GO:0071363;GO:0071287;GO:0071316;GO:0071466;GO:0021987;GO:0042745;GO:0050890;GO:0042416;GO:0006585;GO:0042755;GO:0048596;GO:0042418;GO:0042462;GO:0006631;GO:0016137;GO:0007507;GO:1990384;GO:0033076;GO:0007612;GO:0007626;GO:0007617;GO:0007613;GO:0010259;GO:0042136;GO:0042421;GO:0018963;GO:0052314;GO:0008016;GO:0014823;GO:0001975;GO:0051412;GO:0051602;GO:0032355;GO:0045471;GO:0045472;GO:0070848;GO:0009635;GO:0001666;GO:0035902;GO:0017085;GO:0035900;GO:0009416;GO:0032496;GO:0010038;GO:0035094;GO:0031667;GO:0014070;GO:0043434;GO:0046684;GO:0009651;GO:0048545;GO:0009414;GO:0009410;GO:0010043;GO:0007605;GO:0035176;GO:0006665;GO:0001963;GO:0042214;GO:0007601
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       <NA>
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       <NA>
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         GO:0071215;GO:0070417;GO:0006974;GO:0051276;GO:0032508;GO:0006310;GO:0006281;GO:0006268;GO:0000724
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              GO:0010457;GO:0051642;GO:0090222;GO:0048668;GO:0021540;GO:0021957;GO:0034454;GO:0050772;GO:0031116;GO:0008104
##                                                                                                                                                                                    CC_GO_ids
## 1                                                                                                                                                                                           
## 2 GO:0030424;GO:0005737;GO:0009898;GO:0031410;GO:0030659;GO:0005829;GO:0030425;GO:0033162;GO:0005739;GO:0043005;GO:0043025;GO:0005634;GO:0043204;GO:0048471;GO:0005790;GO:0008021;GO:0043195
## 3                                                                                                                                                                                       <NA>
## 4                                                                                                                                                                                       <NA>
## 5                                                                                                                                                GO:0005694;GO:0005737;GO:0005634;GO:0009506
## 6            GO:0045177;GO:0030424;GO:0044295;GO:0120103;GO:0005814;GO:0005813;GO:0097539;GO:0005881;GO:0030425;GO:0072686;GO:0097431;GO:0005730;GO:0005654;GO:0000242;GO:0005886;GO:0000922
##                                                                                                                  MF_GO_ids
## 1                                                                                         GO:0042409;GO:0046872;GO:0008757
## 2 GO:0016597;GO:0035240;GO:0019899;GO:0008199;GO:0008198;GO:0042802;GO:0004497;GO:0019825;GO:0019904;GO:0034617;GO:0004511
## 3                                                                                                                     <NA>
## 4                                                                                                                     <NA>
## 5                                                        GO:0043138;GO:0005524;GO:0016887;GO:0009378;GO:0046872;GO:0003676
## 6                                                                              GO:0005509;GO:0005525;GO:0019900;GO:0051011
##                                                                                                                                                                                                                                              GOslim
## 1                                                                                                                                                                                                                                              <NA>
## 2 GO:0016192;GO:0048856;GO:0048856;GO:0050877;GO:0006520;GO:0048856;GO:0030154;GO:0048856;GO:0006629;GO:1901135;GO:0048856;GO:0048856;GO:0050877;GO:0022414;GO:0050877;GO:0048856;GO:0003013;GO:0050877;GO:0006629;GO:0023052;GO:0006629;GO:0050877
## 3                                                                                                                                                                                                                                              <NA>
## 4                                                                                                                                                                                                                                              <NA>
## 5                                                                                                                                                                                                                  GO:0006260;GO:0006281;GO:0006310
## 6                                                                                         GO:0007010;GO:0007010;GO:0065003;GO:0030154;GO:0048856;GO:0030154;GO:0048856;GO:0030154;GO:0048856;GO:0007010;GO:0030154;GO:0048856;GO:0007010;GO:0065003
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          Term
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        <NA>
## 2 vesicle-mediated transport;anatomical structure development;anatomical structure development;nervous system process;cellular amino acid metabolic process;anatomical structure development;cell differentiation;anatomical structure development;lipid metabolic process;carbohydrate derivative metabolic process;anatomical structure development;anatomical structure development;nervous system process;reproductive process;nervous system process;anatomical structure development;circulatory system process;nervous system process;lipid metabolic process;signaling;lipid metabolic process;nervous system process
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        <NA>
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        <NA>
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                DNA replication;DNA repair;DNA recombination
## 6                                                                                                                                                                                                                     cytoskeleton organization;cytoskeleton organization;protein-containing complex assembly;cell differentiation;anatomical structure development;cell differentiation;anatomical structure development;cell differentiation;anatomical structure development;cytoskeleton organization;cell differentiation;anatomical structure development;cytoskeleton organization;protein-containing complex assembly

Break cells by semi-colon and return only distinct values

#break cells and reform with unique values only
distinct_goslims <- pgenerosa_simple_goslims %>%
  mutate(Term_unique = lapply(strsplit(as.character(Term), ";"), function(Term_unique) paste0(unique(Term_unique), collapse = ";")))  %>% distinct(Term_unique, .keep_all = TRUE) %>%
  mutate(GOslim_unique = lapply(strsplit(as.character(GOslim),";"),function(GOslim_unique) paste0(unique(GOslim_unique), collapse = ";"))) %>% 
  distinct(GOslim_unique, .keep_all = TRUE)


head(distinct_goslims)
##         target_id            gene ctenidia    gonad    heart juvenile   larvae
## 1 PGEN_.00g000010 PGEN_.00g000010 0.000000 0.000000 0.000000 4.851851 3.423667
## 2 PGEN_.00g000020 PGEN_.00g000020 0.000000 0.000000 0.000000 0.840164 0.370266
## 3 PGEN_.00g000050 PGEN_.00g000050 0.508251 4.745168 0.228272 0.182728 1.117655
## 4 PGEN_.00g000060 PGEN_.00g000060 6.490179 0.000000 0.000000 6.742646 5.936612
## 5 PGEN_.00g000080 PGEN_.00g000080 0.000000 0.000000 0.119488 0.229570 0.000000
## 6 PGEN_.00g000090 PGEN_.00g000090 0.187374 0.000000 0.000000 0.173312 0.000000
##                                                    accessions gene_id gene_name
## 1                                               Q86IC9;Q552T5 8620183      omt5
## 2                                                      P04177   25085        Th
## 3                                        Q8L840;O04092;Q9FT71  837636   RECQL4A
## 4 Q61043;A0A1Y7VJL5;B2RQ73;B7ZMZ9;E9Q488;E9Q4S3;Q674R4;Q6ZPM7   18080       Nin
## 5                                                      A1E2V0  489433     BIRC3
## 6                                                      P34456  186266          
##                              gene_description
## 1 Probable caffeoyl-CoA O-methyltransferase 1
## 2                    Tyrosine 3-monooxygenase
## 3        ATP-dependent DNA helicase Q-like 4A
## 4                                      Ninein
## 5 Baculoviral IAP repeat-containing protein 3
## 6            Uncharacterized protein F54H12.2
##                       alt_gene_description
## 1                    O-methyltransferase 5
## 2                   Tyrosine 3-hydroxylase
## 3                        SGS1-like protein
## 4                        SGS1-like protein
## 5 RING-type E3 ubiquitin transferase BIRC3
## 6 RING-type E3 ubiquitin transferase BIRC3
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       all_GO_ids
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    GO:0042409;GO:0046872;GO:0008757;GO:0032259
## 2 GO:0030424;GO:0005737;GO:0009898;GO:0031410;GO:0030659;GO:0005829;GO:0030425;GO:0033162;GO:0005739;GO:0043005;GO:0043025;GO:0005634;GO:0043204;GO:0048471;GO:0005790;GO:0008021;GO:0043195;GO:0016597;GO:0035240;GO:0019899;GO:0008199;GO:0008198;GO:0042802;GO:0004497;GO:0019825;GO:0019904;GO:0034617;GO:0004511;GO:0015842;GO:0009887;GO:0042423;GO:0071312;GO:0071333;GO:0071363;GO:0071287;GO:0071316;GO:0071466;GO:0021987;GO:0042745;GO:0050890;GO:0042416;GO:0006585;GO:0042755;GO:0048596;GO:0042418;GO:0042462;GO:0006631;GO:0016137;GO:0007507;GO:1990384;GO:0033076;GO:0007612;GO:0007626;GO:0007617;GO:0007613;GO:0010259;GO:0042136;GO:0042421;GO:0018963;GO:0052314;GO:0008016;GO:0014823;GO:0001975;GO:0051412;GO:0051602;GO:0032355;GO:0045471;GO:0045472;GO:0070848;GO:0009635;GO:0001666;GO:0035902;GO:0017085;GO:0035900;GO:0009416;GO:0032496;GO:0010038;GO:0035094;GO:0031667;GO:0014070;GO:0043434;GO:0046684;GO:0009651;GO:0048545;GO:0009414;GO:0009410;GO:0010043;GO:0007605;GO:0035176;GO:0006665;GO:0001963;GO:0042214;GO:0007601
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               GO:0005694;GO:0005737;GO:0005634;GO:0009506;GO:0043138;GO:0005524;GO:0016887;GO:0009378;GO:0046872;GO:0003676;GO:0071215;GO:0070417;GO:0006974;GO:0051276;GO:0032508;GO:0006310;GO:0006281;GO:0006268;GO:0000724
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      GO:0045177;GO:0030424;GO:0044295;GO:0120103;GO:0005814;GO:0005813;GO:0097539;GO:0005881;GO:0030425;GO:0072686;GO:0097431;GO:0005730;GO:0005654;GO:0000242;GO:0005886;GO:0000922;GO:0005509;GO:0005525;GO:0019900;GO:0051011;GO:0010457;GO:0051642;GO:0090222;GO:0048668;GO:0021540;GO:0021957;GO:0034454;GO:0050772;GO:0031116;GO:0008104
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       GO:0005737;GO:0005829;GO:0005654;GO:0005634;GO:0043027;GO:0046872;GO:0061630;GO:0043066;GO:0060546;GO:0031398;GO:0051726
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               GO:0005829;GO:0004748;GO:0009263
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    BP_GO_ids
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 GO:0032259
## 2 GO:0015842;GO:0009887;GO:0042423;GO:0071312;GO:0071333;GO:0071363;GO:0071287;GO:0071316;GO:0071466;GO:0021987;GO:0042745;GO:0050890;GO:0042416;GO:0006585;GO:0042755;GO:0048596;GO:0042418;GO:0042462;GO:0006631;GO:0016137;GO:0007507;GO:1990384;GO:0033076;GO:0007612;GO:0007626;GO:0007617;GO:0007613;GO:0010259;GO:0042136;GO:0042421;GO:0018963;GO:0052314;GO:0008016;GO:0014823;GO:0001975;GO:0051412;GO:0051602;GO:0032355;GO:0045471;GO:0045472;GO:0070848;GO:0009635;GO:0001666;GO:0035902;GO:0017085;GO:0035900;GO:0009416;GO:0032496;GO:0010038;GO:0035094;GO:0031667;GO:0014070;GO:0043434;GO:0046684;GO:0009651;GO:0048545;GO:0009414;GO:0009410;GO:0010043;GO:0007605;GO:0035176;GO:0006665;GO:0001963;GO:0042214;GO:0007601
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                         GO:0071215;GO:0070417;GO:0006974;GO:0051276;GO:0032508;GO:0006310;GO:0006281;GO:0006268;GO:0000724
## 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              GO:0010457;GO:0051642;GO:0090222;GO:0048668;GO:0021540;GO:0021957;GO:0034454;GO:0050772;GO:0031116;GO:0008104
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                GO:0043066;GO:0060546;GO:0031398;GO:0051726
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 GO:0009263
##                                                                                                                                                                                    CC_GO_ids
## 1                                                                                                                                                                                           
## 2 GO:0030424;GO:0005737;GO:0009898;GO:0031410;GO:0030659;GO:0005829;GO:0030425;GO:0033162;GO:0005739;GO:0043005;GO:0043025;GO:0005634;GO:0043204;GO:0048471;GO:0005790;GO:0008021;GO:0043195
## 3                                                                                                                                                GO:0005694;GO:0005737;GO:0005634;GO:0009506
## 4            GO:0045177;GO:0030424;GO:0044295;GO:0120103;GO:0005814;GO:0005813;GO:0097539;GO:0005881;GO:0030425;GO:0072686;GO:0097431;GO:0005730;GO:0005654;GO:0000242;GO:0005886;GO:0000922
## 5                                                                                                                                                GO:0005737;GO:0005829;GO:0005654;GO:0005634
## 6                                                                                                                                                                                 GO:0005829
##                                                                                                                  MF_GO_ids
## 1                                                                                         GO:0042409;GO:0046872;GO:0008757
## 2 GO:0016597;GO:0035240;GO:0019899;GO:0008199;GO:0008198;GO:0042802;GO:0004497;GO:0019825;GO:0019904;GO:0034617;GO:0004511
## 3                                                        GO:0043138;GO:0005524;GO:0016887;GO:0009378;GO:0046872;GO:0003676
## 4                                                                              GO:0005509;GO:0005525;GO:0019900;GO:0051011
## 5                                                                                         GO:0043027;GO:0046872;GO:0061630
## 6                                                                                                               GO:0004748
##                                                                                                                                                                                                                                              GOslim
## 1                                                                                                                                                                                                                                              <NA>
## 2 GO:0016192;GO:0048856;GO:0048856;GO:0050877;GO:0006520;GO:0048856;GO:0030154;GO:0048856;GO:0006629;GO:1901135;GO:0048856;GO:0048856;GO:0050877;GO:0022414;GO:0050877;GO:0048856;GO:0003013;GO:0050877;GO:0006629;GO:0023052;GO:0006629;GO:0050877
## 3                                                                                                                                                                                                                  GO:0006260;GO:0006281;GO:0006310
## 4                                                                                         GO:0007010;GO:0007010;GO:0065003;GO:0030154;GO:0048856;GO:0030154;GO:0048856;GO:0030154;GO:0048856;GO:0007010;GO:0030154;GO:0048856;GO:0007010;GO:0065003
## 5                                                                                                                                                                                                                             GO:0012501;GO:0012501
## 6                                                                                                                                                                                                                             GO:0055086;GO:1901135
##                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          Term
## 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        <NA>
## 2 vesicle-mediated transport;anatomical structure development;anatomical structure development;nervous system process;cellular amino acid metabolic process;anatomical structure development;cell differentiation;anatomical structure development;lipid metabolic process;carbohydrate derivative metabolic process;anatomical structure development;anatomical structure development;nervous system process;reproductive process;nervous system process;anatomical structure development;circulatory system process;nervous system process;lipid metabolic process;signaling;lipid metabolic process;nervous system process
## 3                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                DNA replication;DNA repair;DNA recombination
## 4                                                                                                                                                                                                                     cytoskeleton organization;cytoskeleton organization;protein-containing complex assembly;cell differentiation;anatomical structure development;cell differentiation;anatomical structure development;cell differentiation;anatomical structure development;cytoskeleton organization;cell differentiation;anatomical structure development;cytoskeleton organization;protein-containing complex assembly
## 5                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 programmed cell death;programmed cell death
## 6                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            nucleobase-containing small molecule metabolic process;carbohydrate derivative metabolic process
##                                                                                                                                                                                                                                                                 Term_unique
## 1                                                                                                                                                                                                                                                                        NA
## 2 vesicle-mediated transport;anatomical structure development;nervous system process;cellular amino acid metabolic process;cell differentiation;lipid metabolic process;carbohydrate derivative metabolic process;reproductive process;circulatory system process;signaling
## 3                                                                                                                                                                                                                              DNA replication;DNA repair;DNA recombination
## 4                                                                                                                                                       cytoskeleton organization;protein-containing complex assembly;cell differentiation;anatomical structure development
## 5                                                                                                                                                                                                                                                     programmed cell death
## 6                                                                                                                                                                          nucleobase-containing small molecule metabolic process;carbohydrate derivative metabolic process
##                                                                                                   GOslim_unique
## 1                                                                                                            NA
## 2 GO:0016192;GO:0048856;GO:0050877;GO:0006520;GO:0030154;GO:0006629;GO:1901135;GO:0022414;GO:0003013;GO:0023052
## 3                                                                              GO:0006260;GO:0006281;GO:0006310
## 4                                                                   GO:0007010;GO:0065003;GO:0030154;GO:0048856
## 5                                                                                                    GO:0012501
## 6                                                                                         GO:0055086;GO:1901135

SPECIES

  • Mercenaria and Manila Clams
GOterms count, removing duplicates
transcriptome Term_unique n
Pgenerosa anatomical structure development 1853
Pgenerosa signaling 1603
Pgenerosa cell differentiation 1281
Pgenerosa DNA-templated transcription 741
Pgenerosa regulation of DNA-templated transcription 678
Pgenerosa immune system process 670
Pgenerosa programmed cell death 600

normalize species by Pgenerosa transcriptome

#normalize by Pgen transcriptome
sum_terms<- term_count_Pgen %>% #count terms in n 
  summarise(total_n = sum(n)) #17,611

Pgen_normalized<- term_count_Pgen %>%
  mutate(Pgen_normalized = n/17611)

normal_counts<- term_count_best %>%
  group_by(transcriptome) %>%
  summarise(total_n = sum(n))
#Pgen = 17,611
#Manila = 1235
#Manila_r = 1390
#Mercenaria = 2198
#Mercenaria_r = 7027

kable(normal_counts[1:7,], caption="Total Terms per Species")
Total Terms per Species
transcriptome total_n
Manila 1235
Manila_r 1390
Mercenaria 2198
Mercenaria_r 7027
Pgenerosa 17611
NA NA
NA NA
filtered_data1 <- term_count_best %>%
  filter(transcriptome %in% c("Mercenaria_r", "Manila", "Mercenaria", "Manila_r")) %>%
  mutate(n_divided = case_when(
                               transcriptome == "Manila" ~ n/1235,
                               transcriptome == "Manila_r" ~ n/1390,
                               transcriptome == "Mercenaria" ~ n/2198,
                               transcriptome == "Mercenaria_r" ~ n/7027))


grouped_data1<-left_join(filtered_data1, Pgen_normalized, by="Term_unique")

species_normal<-grouped_data1 %>%
  mutate(normalized = n_divided/Pgen_normalized)%>%
  rename(n_species = n.x) %>%
  rename(n_Pgen = n.y) %>%
  mutate(log_scale = log(normalized))
#for heatmap
## Mercenaria_evalue     Manila_evalue       Pgen_evalue 
##               980               210              1029
## 111 101 011 001 
## 202 778   8  41

Tissues

GOterms by tissue
tissue Term_unique n
juvenile anatomical structure development 1817
larvae anatomical structure development 1743
heart anatomical structure development 1678
ctenidia anatomical structure development 1661
juvenile signaling 1572

Normalize Tissues by Pgenerosa Transcriptome

Total Terms per Tissue(s)
tissue total_n
ctenidia 15911
gonad 14715
heart 16021
juvenile 17277
larvae 16632
NA NA

Tissue Heatmap normalized by P. generosa transcriptome where white = 0.9

Species Heatmap normalized by P. generosa transcriptopme where white = 0.9