Gene SAG0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SAG0039
Symbol
ID	1012789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Streptococcus agalactiae 2603V/R
Kingdom	Bacteria
Replicon accession	NC_004116
Strand	+
Start bp	54083
End bp	55000
Gene Length	918 bp
Protein Length	305 aa
Translation table	11
GC content	36%
IMG OID	637315194
Product	N-acetylneuraminate lyase, putative
Protein accession	NP_687075
Protein GI	22536224
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID	[TIGR00683] N-acetylneuraminate lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGATT TACAAAAATA TCAAGGAATT ATTCCTGCAT TTTATGCTTG CTATGATGAT 
AAGGGTGATA TTTGTCCCGA ACGAGTAAAA GCCCTGACCA ATTATTTTAT TGATAAAGGT 
GTTCAAGGAC TTTATGTTAA TGGTTCATCC GGAGAATGTA TTTACCAAAG TGTAGCAGAT 
CGTAAACTTG TACTGGAAAA TGTTATGTCC GTTGCTAAGG GTAAACTAAC AGTAATAGCG 
CATGTGGCAT GTAATAATAC TAAGGATAGC GTAGAGTTGG CTATGCATGC TGAAGCTATA 
GGTGTTGATG CTATTGCAGC AATTCCACCA ATTTATTTTC GATTACCAGA GTATGCCATA 
GCAGATTATT GGAATACTAT TAGTCAAGCA GCACCACAAA CTGATTTTAT TATTTACAAT 
ATTCCTCAAT TGGCAGGGGT TGCTTTGACA TCGGATTTAT ATCGAAAAAT GTTACAAAAT 
CCGCAAGTAA TTGGTGTTAA AAATTCTTCC ATGCCAGTTC AAGACATTCA GAATTTTGTG 
GCTATTGGAG GAGAAAATCA TATTGTTTTT AATGGTCCAG ATGAACAATT TTTGGGTGGT 
CGTCTCATGG GAGCCGCTGC AGGTATTGGT GGTACCTATG GCGTAATGCC AGAATTATAC 
TTGACTTTAA ATCAGTTAAT TGTTGATAAA GATTTAGAAA AAGCGCGTGA ACTTCAATTT 
ACAATTAACG ATATTATCAC AAAGCTTTGT TCGGGTCATG GTAATATGTA TGCTGTGATC 
AAAGCTGTAT TGGAAATCAA TGAGCAACTA ACTATAGGTT CCGTTCGGTT ACCTTTAGCA 
TCTGTAACAG AAGAAGATAA ACCTATTATT AAAGAGGCAG CAGAAATGAT TAGACATGCT 
AAAAAACAGT TTTGTTAA

Protein sequence

MKDLQKYQGI IPAFYACYDD KGDICPERVK ALTNYFIDKG VQGLYVNGSS GECIYQSVAD 
RKLVLENVMS VAKGKLTVIA HVACNNTKDS VELAMHAEAI GVDAIAAIPP IYFRLPEYAI 
ADYWNTISQA APQTDFIIYN IPQLAGVALT SDLYRKMLQN PQVIGVKNSS MPVQDIQNFV 
AIGGENHIVF NGPDEQFLGG RLMGAAAGIG GTYGVMPELY LTLNQLIVDK DLEKARELQF 
TINDIITKLC SGHGNMYAVI KAVLEINEQL TIGSVRLPLA SVTEEDKPII KEAAEMIRHA 
KKQFC