Gene EcSMS35_4937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4937
Symbol	serB
ID	6144234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	5051782
End bp	5052750
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	56%
IMG OID	641619740
Product	phosphoserine phosphatase
Protein accession	YP_001746844
Protein GI	170681720
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0560] Phosphoserine phosphatase
TIGRFAM ID	[TIGR00338] phosphoserine phosphatase SerB [TIGR01488] Haloacid Dehalogenase superfamily, subfamily IB, phosphoserine phosphatase-like

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	0.859759
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAACA TTACCTGGTG CGACCTGCCT GAAGATGTCT CTTTATGGCC TGGTCTGCCT 
CTTTCATTAA GTGGTGATGA AGTGATGCCA CTGGATTACC ACGCAGGTCG TAGCGGCTGG 
CTGCTGTATG GTCGTGGGCT GGATAAACAA CGTCTGACCC AATACCAGAG CAAACTGGGC 
GCGGCTATGG TGATTGTTGC CGCCTGGTGC GTGGAAGATT ATCAGGTGAT TCGTCTGGCA 
GGTTCACTCA CCGCGCGGGC TACGCGCCTG GCCCACGAAG CGCAACTGGA TGTCGCGCCG 
TTGGGGAAAA TCCCGCACCT GCGCTCTCCG GGTTTGCTGG TGATGGACAT GGATTCCACC 
GCCATTCAGA TTGAATGTAT TGACGAAATT GCCAAACTGG CCGGAACCGG CGAGATGGTG 
GCGGAGGTAA CCGAACGGGC GATGCGCGGC GAACTCGATT TTACCGCCAG CCTGCGCAGC 
CGTGTGGCGA CGCTGAAAGG CGCTGACGCC AATATCCTGC AACAGGTGCG TGAAAATCTG 
CCGCTGATGC CAGGCTTAAC GCAACTGGTG CTCAAGCTGG AAACGCTGGG CTGGAAAGTG 
GCGATTGCTT CCGGCGGCTT TACTTTCTTT GCTGAATACC TGCGCGACAA GCTGCGCCTG 
ACAGCCGTGG TAGCCAATGA ACTGGAGATC ATGGACGGTA AATTTACCGG CAATGTGATC 
GGCGACATCG TAGACGCGCA GTACAAAGCG AAAACTCTGA CTCGCCTCGC GCAGGAGTAT 
GAAATCCCGC TGGCGCAGAC CGTGGCGATT GGCGATGGAG CCAATGACCT GCCGATGATC 
AAAGCGGCAG GGCTGGGGAT TGCCTACCAT GCCAAGCCAA AAGTGAATGA AAAAACGGAA 
GTCACCATCC GTCACGCTGA CCTGATGGGG GTATTCTGCA TCCTCTCTGG CAGCCTGAAT 
CAGAAGTAA

Protein sequence

MPNITWCDLP EDVSLWPGLP LSLSGDEVMP LDYHAGRSGW LLYGRGLDKQ RLTQYQSKLG 
AAMVIVAAWC VEDYQVIRLA GSLTARATRL AHEAQLDVAP LGKIPHLRSP GLLVMDMDST 
AIQIECIDEI AKLAGTGEMV AEVTERAMRG ELDFTASLRS RVATLKGADA NILQQVRENL 
PLMPGLTQLV LKLETLGWKV AIASGGFTFF AEYLRDKLRL TAVVANELEI MDGKFTGNVI 
GDIVDAQYKA KTLTRLAQEY EIPLAQTVAI GDGANDLPMI KAAGLGIAYH AKPKVNEKTE 
VTIRHADLMG VFCILSGSLN QK