Gene SAG1161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG1161
Symbol	neuB
ID	1013968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	-
Start bp	1165626
End bp	1166651
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	36%
IMG OID	637316346
Product	N-acetyl neuramic acid synthetase NeuB
Protein accession	NP_688170
Protein GI	22537319
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2089] Sialic acid synthase
TIGRFAM ID	[TIGR03569] N-acetylneuraminate synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTTATA TTATTGCAGA GATTGGTTGC AATCATAATG GAGATATTAA TCTTGCGAAA 
AAAATGGTAG ATGTTGCCGT GTCTTGTGGT GTTGATGCTG TTAAATTTCA GACTTTTAAA 
GCTGAGAAAC TTATTTCTAA ATTTGCTCCC AAAGCTGAAT ATCAAAAAGC AACTACAGGA 
ACAGCAGACA GTCAACTTGA GATGACGAAA CGTTTAGAGT TAAGCTTTGA AGAATACTTA 
GAAATGCGTG ATTATGCAAT TTCAAAAGGT GTGGAGACCT TTTCAACACC TTTTGATGAA 
GAGTCATTAG AGTTCTTAAT TTCTACAGAT ATGCCAATTT ACAAAATTCC ATCAGGAGAA 
ATCACTAATT TACCTTACTT AGAAAAGATT GGCAAGCAAC AAAAGAAAGT TATTCTTTCG 
ACGGGTATGG CGGTAATGGA AGAGATCCAT CAAGCGGTGA ATATTTTACG TCAGAATGGT 
ACAACCGACA TTTCTATTTT ACATTGTACA ACAGAGTACC CAACACCTTA CCCCTCTCTA 
AATTTAAACG TTATTCATAC TTTGAAAGAT GAATTTAAAG ATTTAACGAT AGGTTATTCG 
GATCATTCAA TTGGATCAGA AGTACCTATC GCAGCAGCAG CAATGGGTGC AGAAGTTATT 
GAAAAACACT TTACTTTAGA TACTAATATG GAAGGTCCGG ATCATAAAGC CAGTGCAACA 
CCTGATATTT TAGCTGCTTT AGTTAAAGGG GTTCGCATTG TTGAACAAGC CTTAGGTAGA 
TTTGAAAAAA TCCCAGATCC AGTAGAAGAA AAAAATAAGA TTGTTGCTCG TAAATCAGTC 
GTTGCTTTAA AACCAATTAA AAAAGGCGAT ATTTATTCAA TAGAAAATAT TACGGTGAAG 
CGCCCAGGTA ATGGTATTTC TCCTATGAAC TGGTATGACA TCTTGGGACA AGAAGCGCAA 
GATGATTTCG AAGAGGATGA AGTTATTCGT GATTCACGCT TTGAAAATCA ATTGCCCGAG 
TTATAA

Protein sequence

MVYIIAEIGC NHNGDINLAK KMVDVAVSCG VDAVKFQTFK AEKLISKFAP KAEYQKATTG 
TADSQLEMTK RLELSFEEYL EMRDYAISKG VETFSTPFDE ESLEFLISTD MPIYKIPSGE 
ITNLPYLEKI GKQQKKVILS TGMAVMEEIH QAVNILRQNG TTDISILHCT TEYPTPYPSL 
NLNVIHTLKD EFKDLTIGYS DHSIGSEVPI AAAAMGAEVI EKHFTLDTNM EGPDHKASAT 
PDILAALVKG VRIVEQALGR FEKIPDPVEE KNKIVARKSV VALKPIKKGD IYSIENITVK 
RPGNGISPMN WYDILGQEAQ DDFEEDEVIR DSRFENQLPE L