Gene SAG1901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1901
Symbol
ID	1014711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1881797
End bp	1882993
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	37%
IMG OID	637317069
Product	glucuronyl hydrolase
Protein accession	NP_688890
Protein GI	22538039
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0842468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAAAA TAAAACCGGT CAAGGTTGAG TCAATTGAAA ATCCAAAGCG TTTTTTAAAC 
AGTAGATTAT TAACTAAGAT TGAAGTTGAG GAAGCGATTG AAAAAGCCTT GAAGCAACTT 
TATATTAATA TTGATTACTT TGGTGAAGAG TATCCAACGC CTGCAACATT CAATAATATT 
TATAAAGTTA TGGATAACAC AGAATGGACA AATGGTTTTT GGACAGGGTG CTTGTGGTTA 
GCTTATGAGT ATAATCAGGA TAAAAAGTTA AAAAACATAG CCCACAAAAA TGTATTGTCA 
TTTCTAAATC GTATTAATAA TCGTATAGCA TTAGATCACC ACGACTTAGG ATTTCTTTAC 
ACACCATCTT GTACAGCAGA ATATCGTATC AATGGTGATG TTAAAGCTTT AGAAGCCACT 
ATAAAAGCTG CAGATAAATT GATGGAGCGC TATCAAGAAA AAGGTGGATT TATTCAGGCT 
TGGGGAGAAC TCGGGTATAA GGAACACTAT CGCTTAATTA TCGATTGCTT ACTTAATATC 
CAACTCTTAT TTTTTGCTTA TGAACAGACA GGTGATGAAA AGTATAGACA AGTTGCGGTG 
AATCACTTCT ACGCTTCAGC TAACAATGTG GTGCGTGATG ATTCTTCTGC TTTTCATACT 
TTTTATTTCG ACCCAGAAAC TGGAGAACCG TTAAAAGGTG TCACACGACA GGGTTATAGT 
GATGAGTCAT CTTGGGCAAG AGGGCAAGCA TGGGGCATCT ACGGTATTCC GCTTAGTTAC 
CGGAAAATGA AAGATTATCA GCAGATTATC CTTTTTAAAG GTATGACAAA CTATTTTCTA 
AATCGTTTAC CTGAAGACAA GGTATCCTAT TGGGACCTTA TTTTTACGGA TGGCTCGGGC 
CAGCCTAGAG ATACATCCGC AACAGCAACG GCTGTGTGTG GAATTCATGA GATGCTTAAA 
TATTTACCAG AAGTAGATCC TGATAAAGAG ACATACAAAT ATGCTATGCA TACAATGCTT 
CGTAGTCTGA TTGAACAGTA TAGTAATAAT GAACTTATAG CAGGACGTCC TCTTCTATTG 
CACGGTGTGT ATTCGTGGCA TTCAGGTAAA GGAGTAGATG AAGGTAATAT TTGGGGAGAT 
TATTATTACT TAGAAGCCTT AATAAGATTC TATAAAGACT GGGAACTTTA TTGGTAA

Protein sequence

MMKIKPVKVE SIENPKRFLN SRLLTKIEVE EAIEKALKQL YINIDYFGEE YPTPATFNNI 
YKVMDNTEWT NGFWTGCLWL AYEYNQDKKL KNIAHKNVLS FLNRINNRIA LDHHDLGFLY 
TPSCTAEYRI NGDVKALEAT IKAADKLMER YQEKGGFIQA WGELGYKEHY RLIIDCLLNI 
QLLFFAYEQT GDEKYRQVAV NHFYASANNV VRDDSSAFHT FYFDPETGEP LKGVTRQGYS 
DESSWARGQA WGIYGIPLSY RKMKDYQQII LFKGMTNYFL NRLPEDKVSY WDLIFTDGSG 
QPRDTSATAT AVCGIHEMLK YLPEVDPDKE TYKYAMHTML RSLIEQYSNN ELIAGRPLLL 
HGVYSWHSGK GVDEGNIWGD YYYLEALIRF YKDWELYW