Gene ECH74115_5902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5902
Symbol	serB
ID	6970436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	5555318
End bp	5556286
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	57%
IMG OID	643389517
Product	phosphoserine phosphatase
Protein accession	YP_002273908
Protein GI	209398522
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0560] Phosphoserine phosphatase
TIGRFAM ID	[TIGR00338] phosphoserine phosphatase SerB [TIGR01488] Haloacid Dehalogenase superfamily, subfamily IB, phosphoserine phosphatase-like

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAACA TTACCTGGTG CGACCTGCCT GAAGATGTCT CTTTATGGCC GGGTCTGCCT 
CTTTCATTAA GTGGTGATGA AGTGATGCCA CTGGATTACC ACGCAGGTCG TAGCGGCTGG 
CTGCTGTATG GTCGTGGGCT GGATAAACAG CGTCTGACCC AATACCAGAG CAAACTGGGT 
GCGGCGATGG TGATTGTTGC CGCCTGGTGC GTGGAAGATT ATCAGGTGAT TCGTCTGGCA 
GGTTCACTCA CCGCACGGGC TACACGCCTG GCCCACGAAG CGCAGCTGGA TGTCGCGCCG 
CTGGGAAAAA TCCCGCACCT GCGCACGCCG GGTTTGCTGG TGATGGACAT GGATTCCACC 
GCCATCCAGA TTGAATGTAT TGATGAAATT GCCAAACTGG CCGGAACGGG CGAGATGGTG 
GCGGAAGTAA CCGAACGGGC GATGCGCGGC GAACTCGATT TTACCGCCAG CCTGCGCAGC 
CGCGTGGCGA CGCTGAAAGG CGCTGACGCC AATATTCTGC AACAGGTGCG TGAAAATCTG 
CCGCTGATGC CAGGCTTAAC GCAACTGGTG CTCAAGCTGG AAACGCTGGG CTGGAAAGTG 
GCGATTGCCT CCGGCGGCTT TACTTTCTTT GCTGAATACC TGCGCGACAA GCTGCGCCTG 
ACAGCCGTGG TAGCCAATGA ACTGGAGATC ATGGACGGTA AATTTACCGG CAATGTGATC 
GGCGACATCG TAGACGCGCA GTACAAAGCG AAAACTCTGA CTCGCCTCGC GCAGGAGTAT 
GAAATCCCGC TGGCGCAGAC CGTGGCGATT GGCGATGGAG CCAATGACCT GCCGATGATC 
AAAGCGGCAG GGCTGGGGAT TGCCTACCAT GCCAAGCCAA AAGTGAATGA AAAGGCGGAA 
GTCACCATCC GTCACGCTGA CCTGATGGGG GTATTCTGCA TCCTCTCAGG CAGCCTGAAT 
CAGAAGTAA

Protein sequence

MPNITWCDLP EDVSLWPGLP LSLSGDEVMP LDYHAGRSGW LLYGRGLDKQ RLTQYQSKLG 
AAMVIVAAWC VEDYQVIRLA GSLTARATRL AHEAQLDVAP LGKIPHLRTP GLLVMDMDST 
AIQIECIDEI AKLAGTGEMV AEVTERAMRG ELDFTASLRS RVATLKGADA NILQQVRENL 
PLMPGLTQLV LKLETLGWKV AIASGGFTFF AEYLRDKLRL TAVVANELEI MDGKFTGNVI 
GDIVDAQYKA KTLTRLAQEY EIPLAQTVAI GDGANDLPMI KAAGLGIAYH AKPKVNEKAE 
VTIRHADLMG VFCILSGSLN QK