Gene EcE24377A_4098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4098
Symbol	mtlA
ID	5590822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	4085443
End bp	4087356
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	54%
IMG OID	640927717
Product	PTS system, mannitol-specific IIABC component
Protein accession	YP_001465077
Protein GI	157155646
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2213] Phosphotransferase system, mannitol-specific IIBC component [COG4668] Mannitol/fructose-specific phosphotransferase system, IIA domain
TIGRFAM ID	[TIGR00851] PTS system, mannitol-specific IIC component

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATCCG ATATTAAGAT CAAAGTGCAA AGCTTTGGTC GTTTCCTCAG CAACATGGTG 
ATGCCAAATA TCGGCGCGTT TATCGCGTGG GGTATCATCA CCGCGTTATT TATTCCAACA 
GGGTGGTTAC CGAACGAGAC GCTGGCGAAG CTGGTCGGGC CGATGATCAC TTATCTCCTG 
CCGCTGCTGA TCGGTTATAC CGGTGGTAAG CTGGTAGGCG GCGAACGTGG CGGCGTAGTC 
GGTGCCATCA CCACCATGGG CGTTATCGTC GGCGCAGACA TGCCGATGTT CCTCGGTTCT 
ATGATTGCAG GTCCGCTGGG CGGCTGGTGC ATTAAGCACT TCGACCGCTG GGTAGACGGT 
AAGATCAAAT CCGGTTTTGA GATGCTGGTG AATAACTTCT CCGCAGGCAT CATCGGGATG 
ATCCTCGCTA TTCTGGCATT CCTCGGCATT GGCCCGATTG TTGAAGCCCT GTCCAAAATG 
CTGGCTGCGG GCGTTAACTT CATGGTTGTC CATGACATGC TGCCGCTGGC GTCTATCTTT 
GTTGAACCGG CGAAAATCCT GTTCCTCAAC AACGCCATTA ACCACGGTAT CTTCTCGCCG 
CTGGGTATTC AGCAGTCCCA TGAATTGGGT AAATCAATCT TCTTCCTGAT TGAAGCTAAC 
CCAGGTCCAG GTATGGGCGT GCTGCTGGCG TACATGTTCT TTGGTCGTGG TAGCGCTAAA 
CAGTCTGCGG GCGGTGCGGC AATCATCCAC TTCCTGGGGG GTATCCACGA AATCTACTTC 
CCGTATGTGC TGATGAATCC GCGTCTGATC CTCGCAGTCA TCCTCGGCGG TATGACTGGC 
GTGTTCACGC TGACTATCCT GGGCGGTGGT CTGGTTTCTC CGGCATCTCC GGGTTCTATC 
CTTGCTGTAC TGGCGATGAC ACCAAAAGGT GCTTATTTCG CTAACATCGC GGGTGTGTGT 
GCGGCGATGG CTGTCTCCTT CGTTGTCTCT GCTATTTTGC TGAAAACCAG CAAAGTGAAA 
GAAGAAGATG ATATTGAAGC AGCAACTCGT CGTATGCAGG ACATGAAAGC TGAGTCTAAA 
GGCACATCTC CGCTGTCTGC GGGCGATGTG ACTAACGACC TGAGCCACGT ACGTAAAATC 
ATCGTTGCCT GTGACGCCGG TATGGGTTCC AGTGCGATGG GCGCAGGCGT GCTGCGTAAG 
AAAATTCAGG ATGCAGGTCT GTCACAGATT TCGGTCACTA ACAGCGCGAT CAACAACCTG 
CCGCCAGATG TGGACCTCGT CATCACTCAC CGTGACCTGA CCGAACGCGC TATGCGCCAG 
GTTCCGCAGG CGCAGCATAT TTCGCTGACC AACTTCCTCG ACAGCGGCCT GTACACCAGC 
CTAACCGAAC GTCTGGTTGC TGCCCAGCGC CATACTGAAA ACGAAGTGAA AGTGAAAGAC 
AGTCTGAAAG ACAGCTTTGA CGATTCCAGT GCTAACCTGT TCAAACTGGG CGCGGAGAAC 
ATCTTCCTCG GTCGCAAAGC AGCAACCAAA GAAGAAGCGA TTCGTTTTGC TGGCGAGCAG 
CTGGTGAAAG GCGGTTACGT TGAGCCGGAA TACGTTCAGG CGATGCTGGA TCGTGAAAAA 
CTGACCCCGA CTTATCTGGG TGAGTCTATC GCGGTGCCAC ACGGTACGGT TGAAGCGAAA 
GATCGCGTAC TGAAAACGGG CGTGGTGTTC TGCCAGTACC CGGAAGGCGT GCGCTTCGGT 
GAAGAAGAAG ATGACATTGC CCGTCTGGTG ATTGGTATTG CAGCCCGTAA CAACGAGCAC 
ATTCAGGTTA TCACCAGCCT GACCAATGCA CTGGATGATG AGTCCGTCAT CGAGCGTCTG 
GCACACACCA CCAGCGTGGA TGAAGTGCTG GAACTGTTGG CAGGTCGTAA GTAA

Protein sequence

MSSDIKIKVQ SFGRFLSNMV MPNIGAFIAW GIITALFIPT GWLPNETLAK LVGPMITYLL 
PLLIGYTGGK LVGGERGGVV GAITTMGVIV GADMPMFLGS MIAGPLGGWC IKHFDRWVDG 
KIKSGFEMLV NNFSAGIIGM ILAILAFLGI GPIVEALSKM LAAGVNFMVV HDMLPLASIF 
VEPAKILFLN NAINHGIFSP LGIQQSHELG KSIFFLIEAN PGPGMGVLLA YMFFGRGSAK 
QSAGGAAIIH FLGGIHEIYF PYVLMNPRLI LAVILGGMTG VFTLTILGGG LVSPASPGSI 
LAVLAMTPKG AYFANIAGVC AAMAVSFVVS AILLKTSKVK EEDDIEAATR RMQDMKAESK 
GTSPLSAGDV TNDLSHVRKI IVACDAGMGS SAMGAGVLRK KIQDAGLSQI SVTNSAINNL 
PPDVDLVITH RDLTERAMRQ VPQAQHISLT NFLDSGLYTS LTERLVAAQR HTENEVKVKD 
SLKDSFDDSS ANLFKLGAEN IFLGRKAATK EEAIRFAGEQ LVKGGYVEPE YVQAMLDREK 
LTPTYLGESI AVPHGTVEAK DRVLKTGVVF CQYPEGVRFG EEEDDIARLV IGIAARNNEH 
IQVITSLTNA LDDESVIERL AHTTSVDEVL ELLAGRK