Gene SAG0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0032
Symbol
ID	1012782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	47521
End bp	48825
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	41%
IMG OID	637315187
Product	group B streptococcal surface immunogenic protein
Protein accession	NP_687068
Protein GI	22536217
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.85122
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATGA ATAAAAAGGT ACTATTGACA TCGACAATGG CAGCTTCGCT ATTATCAGTC 
GCAAGTGTTC AAGCACAAGA AACAGATACG ACGTGGACAG CACGTACTGT TTCAGAGGTA 
AAGGCTGATT TGGTAAAGCA AGACAATAAA TCATCATATA CTGTGAAATA TGGTGATACA 
CTAAGCGTTA TTTCAGAAGC AATGTCAATT GATATGAATG TCTTAGCAAA AATAAATAAC 
ATTGCAGATA TCAATCTTAT TTATCCTGAG ACAACACTGA CAGTAACTTA CGATCAGAAG 
AGTCATACTG CCACTTCAAT GAAAATAGAA ACACCAGCAA CAAATGCTGC TGGTCAAACA 
ACAGCTACTG TGGATTTGAA AACCAATCAA GTTTCTGTTG CAGACCAAAA AGTTTCTCTC 
AATACAATTT CGGAAGGTAT GACACCAGAA GCAGCAACAA CGATTGTTTC GCCAATGAAG 
ACATATTCTT CTGCGCCAGC TTTGAAATCA AAAGAAGTAT TAGCACAAGA GCAAGCTGTT 
AGTCAAGCAG CAGCTAATGA ACAGGTATCA CCAGCTCCTG TGAAGTCGAT TACTTCAGAA 
GTTCCAGCAG CTAAAGAGGA AGTTAAACCA ACTCAGACGT CAGTCAGTCA GTCAACAACA 
GTATCACCAG CTTCTGTTGC CGCTGAAACA CCAGCTCCAG TAGCTAAAGT AGCACCGGTA 
AGAACTGTAG CAGCCCCTAG AGTGGCAAGT GTTAAAGTAG TCACTCCTAA AGTAGAAACT 
GGTGCATCAC CAGAGCATGT ATCAGCTCCA GCAGTTCCTG TGACTACGAC TTCACCAGCT 
ACAGACAGTA AGTTACAAGC GACTGAAGTT AAGAGCGTTC CGGTAGCACA AAAAGCTCCA 
ACAGCAACAC CGGTAGCACA ACCAGCTTCA ACAACAAATG CAGTAGCTGC ACATCCTGAA 
AATGCAGGGC TCCAACCTCA TGTTGCAGCT TATAAAGAAA AAGTAGCGTC AACTTATGGA 
GTTAATGAAT TCAGTACATA CCGTGCGGGA GATCCAGGTG ATCATGGTAA AGGTTTAGCA 
GTTGACTTTA TTGTAGGTAC TAATCAAGCA CTTGGTAATA AAGTTGCACA GTACTCTACA 
CAAAATATGG CAGCAAATAA CATTTCATAT GTTATCTGGC AACAAAAGTT TTACTCAAAT 
ACAAACAGTA TTTATGGACC TGCTAATACT TGGAATGCAA TGCCAGATCG TGGTGGCGTT 
ACTGCCAACC ACTATGACCA CGTTCACGTA TCATTTAACA AATAA

Protein sequence

MKMNKKVLLT STMAASLLSV ASVQAQETDT TWTARTVSEV KADLVKQDNK SSYTVKYGDT 
LSVISEAMSI DMNVLAKINN IADINLIYPE TTLTVTYDQK SHTATSMKIE TPATNAAGQT 
TATVDLKTNQ VSVADQKVSL NTISEGMTPE AATTIVSPMK TYSSAPALKS KEVLAQEQAV 
SQAAANEQVS PAPVKSITSE VPAAKEEVKP TQTSVSQSTT VSPASVAAET PAPVAKVAPV 
RTVAAPRVAS VKVVTPKVET GASPEHVSAP AVPVTTTSPA TDSKLQATEV KSVPVAQKAP 
TATPVAQPAS TTNAVAAHPE NAGLQPHVAA YKEKVASTYG VNEFSTYRAG DPGDHGKGLA 
VDFIVGTNQA LGNKVAQYST QNMAANNISY VIWQQKFYSN TNSIYGPANT WNAMPDRGGV 
TANHYDHVHV SFNK