Gene ECH74115_5872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5872
Symbol	mdoB
ID	6968063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	5529132
End bp	5531423
Gene Length	2292 bp
Protein Length	763 aa
Translation table	11
GC content	52%
IMG OID	643389489
Product	phosphoglycerol transferase I
Protein accession	YP_002273881
Protein GI	209398633
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1368] Phosphoglycerol transferase and related proteins, alkaline phosphatase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.454334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTCAGAAC TACTCTCTTT CGCCCTTTTT CTCGCCTCTG TGCTGATTTA CGCATGGAAA 
GCGGGACGTA ACACCTGGTG GTTTGCAGCC ACATTAACGG TGCTGGGGCT ATTTGTCGTT 
TTAAATATCA CCCTGTTTGC CAGCGACTAT TTTACTGGCG ATGGTATTAA CGACGCGGTT 
CTCTATACCT TAACCAACAG CCTGACCGGT GCTGGCGTCA GCAAATACAT TTTGCCGGGT 
ATCGGCATTG TGCTGGGGCT GACAGCGGTG TTCGGTGCGC TGGGCTGGAT CCTGCGCCGT 
CGTCGCCATC ATCCGCACCA TTTTGGTTAC AGCCTGCTGG CGCTCTTACT GGCGCTGGGT 
TCGGTGGACG CCAGCCCGGC ATTTCGTCAG ATAACGGAAC TGGTGAAATC CCAGTCACGC 
GACGGCGACC CGGACTTTGC GGCTTATTAT AAAGAGCCGT CGAAAACTAT CCCTGACCCG 
AAACTCAACC TGGTTTATAT CTACGGCGAA AGTCTCGAGC GGACCTATTT TGATAACGAG 
GCTTTCCCGG ACCTCACGCC TGAACTGGGC GCGTTGAAAA ATGAAGGCCT GGATTTCAGC 
CACACGCAGC AGCTGCCGGG AACAGATTAC ACGATTGCGG GCATGGTGGC TTCTCAGTGC 
GGCATACCGC TGTTTGCCCC CTTTGAAGGC AACGCCTCCG CTTCTGTTTC CAGCTTCTTC 
CCGCAGAACA TCTGTCTGGG CGATATCCTG AAAAACTCGG GTTATCAGAA CTATTTCGTG 
CAGGGCGCGA ATCTGCGTTT TGCCGGTAAA GATGTGTTCC TGAAGTCGCA TGGCTTCGAC 
CACTTATACG GCTCAGAAGA GCTGAAAAGC GTGGTAGCCG ACCCGCACTA TCGCAACGAC 
TGGGGATTCT ACGACGATAC CGTTCTCGAT GAAGCGTGGA AAAAGTTTGA AGAGCTTTCC 
CGCTCAGGTC AGCGATTCTC ACTGTTTACC CTGACAGTCG ATACCCATCA CCCGGATGGT 
TTTATCTCTC GTACCTGTAA CCGCAAAAAA TATGATTTTG ACGGTAAACC GAATCAGTCA 
TTCAGCGCGG TAAGTTGCAG CCAGGAGAAT ATCGCGACGT TTATCAACAA AATCAAAGCG 
TCACCGTGGT TTAAAGATAC TGTCATCGTC GTCTCTTCTG ACCATTTAGC GATGAACAAC 
ACGGCGTGGA AATACCTCAA TAAGCAGGAT CGCAATAACC TGTTTTTTGT CATTCGTGGC 
GACAAGCCGC AGCAAGAGAC GCTGGCAGTG AAGCGTAACA CGATGGATAA CGGAGCGACA 
GTGCTGGACA TTCTCGGTGG CGATAACTAT CTCGGACTTG GTCGTAGCAG TTTATCCGGG 
CAGTCAATGT CGGAAATCTT CCTCAATATC AAAGAGAAAA CATTGGCGTG GAAGCCGGAT 
ATCATCCGTC TGTGGAAATT CCCTAAAGAG ATGAAAGAGT TCACCATCGA CCAGCAGAAA 
AACATGATTG CCTTCTCGGG TAGCCATTTC CGTTTGCCGC TGCTGTTGCG GGTTTCAGAC 
AAACGCGTGG AACCGCTGCC AGAAAGCGAA TACTCAGCAC CGCTGCGTTT CCAGCTGGCC 
GATTTCGCTC CACGCGACAA TTTCGTCTGG GTTGACCGTT GCTACAAGAT GGCACAACTC 
TGGGCTCCGG AACTGGCACT TTCCACCGAC TGGTGTGTCT CGCAGGGGCA ACTTGGCGGT 
CAGCAAATTG TTCAGCATGT TGACAAAACA ACATGGAAGA GCAAGACGGC ATTTAAAGAT 
ACGGTCATCG ACATGGCGCG TTACAAAGGC AATGTCGATA CGCTGAAGAT TGTTGATAAC 
GATATTCGCT ACAAAGCCGA CAGTTTCATC TTTAACGTCG CCGGTGCGCC AGAAGAGGTG 
AAACAGTTTA GCGGGATTTC CCGTCCGGAG TCGTGGGGCC GCTGGTCCAA CGCGCAGCTG 
GGCGATGAAG TAAAAATCGA GTACAAGCAT CCGCTGCCGA AGAAATTTGA CCTGGTGATT 
ACCGCCAAAG CATACGGCAA TAACGCCAGC CGTCCTATTC CGGTACGCGT AGGCAATGAA 
GAACAAACTC TTGTGCTGGG CAATGAAGTG ACCACCACCA CACTGCATTT CGATAACCCA 
ACCGATGCCG ACACACTGGT AATTGTGCCG CCGGAACCTG TCTCAACCAA CGAAGGGAAT 
ATCCTCGGAC ACTCGCCGCG TAAGCTCGGG ATCGGCATGG TGGAAATTAA AGTGGTAGAA 
CGTGAAGGGT AA

Protein sequence

MSELLSFALF LASVLIYAWK AGRNTWWFAA TLTVLGLFVV LNITLFASDY FTGDGINDAV 
LYTLTNSLTG AGVSKYILPG IGIVLGLTAV FGALGWILRR RRHHPHHFGY SLLALLLALG 
SVDASPAFRQ ITELVKSQSR DGDPDFAAYY KEPSKTIPDP KLNLVYIYGE SLERTYFDNE 
AFPDLTPELG ALKNEGLDFS HTQQLPGTDY TIAGMVASQC GIPLFAPFEG NASASVSSFF 
PQNICLGDIL KNSGYQNYFV QGANLRFAGK DVFLKSHGFD HLYGSEELKS VVADPHYRND 
WGFYDDTVLD EAWKKFEELS RSGQRFSLFT LTVDTHHPDG FISRTCNRKK YDFDGKPNQS 
FSAVSCSQEN IATFINKIKA SPWFKDTVIV VSSDHLAMNN TAWKYLNKQD RNNLFFVIRG 
DKPQQETLAV KRNTMDNGAT VLDILGGDNY LGLGRSSLSG QSMSEIFLNI KEKTLAWKPD 
IIRLWKFPKE MKEFTIDQQK NMIAFSGSHF RLPLLLRVSD KRVEPLPESE YSAPLRFQLA 
DFAPRDNFVW VDRCYKMAQL WAPELALSTD WCVSQGQLGG QQIVQHVDKT TWKSKTAFKD 
TVIDMARYKG NVDTLKIVDN DIRYKADSFI FNVAGAPEEV KQFSGISRPE SWGRWSNAQL 
GDEVKIEYKH PLPKKFDLVI TAKAYGNNAS RPIPVRVGNE EQTLVLGNEV TTTTLHFDNP 
TDADTLVIVP PEPVSTNEGN ILGHSPRKLG IGMVEIKVVE REG