Gene SeHA_C2203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2203
Symbol
ID	6488131
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	2116569
End bp	2117384
Gene Length	816 bp
Protein Length	271 aa
Translation table	11
GC content	55%
IMG OID	642742397
Product	mannosyl-3-phosphoglycerate phosphatase
Protein accession	YP_002046037
Protein GI	194448637
COG category	[R] General function prediction only
COG ID	[COG3769] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01484] HAD-superfamily hydrolase, subfamily IIB [TIGR01486] mannosyl-3-phosphoglycerate phosphatase family [TIGR02463] mannosyl-3-phosphoglycerate phosphatase-related protein

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0526685
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCTCAA TCCATGACCC CTTGCTGATT TTTACCGATC TGGACGGCAC ATTGCTGAAC 
AGCCACACGT TTGAGTGGCA GCCCGCGGCT CCCTGGCTTA CACGCCTGCA TGAAAGCGGC 
GTGCCCGTGA TCCTCTGTAG CAGTAAAACC GCGGCTGAAA TGCTCCAGCT CCAGACGACG 
TTAAATCTAC AGGGACTGCC GCTGATTGCG GAAAACGGCG CGGTGATCCA ACTGGACGTT 
CATTGGGAAG ACCATCCCAA CTATCCCCGC CTGATAGCCG GTATTTCTCA CAACGAAATC 
CGCCTCGTCC TGCATAAATT GCGTGAAAAG GAACAGTTTA AGTTCACCAC GTTTGATGAC 
GTTGACGATC AGGTGATAAG CGAATGGACG GGCCTAAACC GGGCACAGTC TGCCCTAACC 
CGTCTGCATG AAGCGTCGGT GTCGCTGATC TGGCGCGATA GCGATGAACG CATGGCGCAG 
TTTGTCGCCC ATTTAAATGA CCTGGGACTG CAATTTGTCC ATGGCGCCCG TTTCTGGCAT 
GTGCTGGACG CCTCCGCCGG TAAAGATCAG GCTGCCAACT GGCTGATTGA AGCATATCGT 
CGGCAGTGGC GCGCGCGTCC TCTGACGTTG GGACTAGGAG ACGGCCCCAA TGATGCGCCT 
TTACTGGATG TGATGGATTA TGCGGTTGTC GTTAAAGGGC TAAACCGGGA GGGCGTACAT 
TTGCGTAACG ACGATCCTCA GCGCGTCTAC CGTAGCCAGA ACGAAGGGCC GGATGGCTGG 
CGCGAAGGAA TGGACTATTT CTTTTCCCGC TCCTGA

Protein sequence

MLSIHDPLLI FTDLDGTLLN SHTFEWQPAA PWLTRLHESG VPVILCSSKT AAEMLQLQTT 
LNLQGLPLIA ENGAVIQLDV HWEDHPNYPR LIAGISHNEI RLVLHKLREK EQFKFTTFDD 
VDDQVISEWT GLNRAQSALT RLHEASVSLI WRDSDERMAQ FVAHLNDLGL QFVHGARFWH 
VLDASAGKDQ AANWLIEAYR RQWRARPLTL GLGDGPNDAP LLDVMDYAVV VKGLNREGVH 
LRNDDPQRVY RSQNEGPDGW REGMDYFFSR S