Gene EcolC_0113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0113
Symbol
ID	6068598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	120632
End bp	122545
Gene Length	1914 bp
Protein Length	637 aa
Translation table	11
GC content	54%
IMG OID	641599515
Product	PTS system, mannitol-specific IIC subunit
Protein accession	YP_001723124
Protein GI	170018170
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2213] Phosphotransferase system, mannitol-specific IIBC component [COG4668] Mannitol/fructose-specific phosphotransferase system, IIA domain
TIGRFAM ID	[TIGR00851] PTS system, mannitol-specific IIC component

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCCG ATATTAAGAT CAAAGTGCAA AGCTTTGGTC GTTTCCTCAG CAACATGGTG 
ATGCCAAATA TCGGCGCGTT TATCGCGTGG GGTATCATCA CCGCGTTATT TATTCCAACA 
GGGTGGTTAC CGAACGAGAC GCTGGCGAAG CTGGTCGGGC CGATGATCAC TTATCTCCTG 
CCGCTGCTGA TCGGTTATAC CGGTGGTAAG CTGGTAGGCG GCGAACGTGG CGGCGTAGTC 
GGTGCCATCA CCACCATGGG CGTTATCGTC GGCGCAGACA TGCCGATGTT CCTCGGTTCT 
ATGATTGCAG GTCCGCTGGG CGGCTGGTGC ATTAAGCACT TCGACCGCTG GGTAGACGGT 
AAGATCAAAT CCGGTTTTGA GATGCTGGTG AATAACTTCT CCGCAGGCAT CATCGGGATG 
ATCCTCGCTA TTCTGGCATT CCTCGGCATT GGCCCGATTG TTGAAGCCCT GTCCAAAATG 
CTGGCTGCGG GCGTTAACTT CATGGTTGTC CATGACATGC TGCCGCTGGC GTCTATCTTT 
GTTGAACCGG CGAAAATCCT GTTCCTCAAC AACGCCATTA ACCACGGTAT CTTCTCGCCG 
CTGGGTATTC AGCAGTCCCA TGAACTGGGT AAATCAATCT TCTTCCTGAT TGAAGCTAAC 
CCAGGTCCAG GTATGGGCGT GCTGCTGGCG TACATGTTCT TTGGTCGTGG TAGCGCTAAA 
CAGTCTGCGG GCGGTGCGGC AATCATCCAC TTCCTGGGGG GTATCCACGA AATCTACTTC 
CCGTATGTGC TGATGAATCC GCGTCTGATC CTCGCAGTCA TCCTCGGCGG TATGACTGGC 
GTGTTCACGC TGACTATACT GGGCGGTGGT CTGGTTTCTC CGGCATCTCC GGGTTCTATC 
CTTGCTGTAC TGGCGATGAC ACCAAAAGGT GCTTATTTCG CTAACATCGC GGGTGTGTGT 
GCGGCGATGG CTGTCTCCTT CGTTGTCTCT GCTATTTTGC TGAAAACCAG CAAAGTGAAA 
GAAGAAGATG ATATTGAAGC AGCAACTCGT CGTATGCAGG ACATGAAAGC TGAGTCTAAA 
GGCACATCTC CGCTGTCTGC GGGCGATGTG ACTAACGACC TGAGCCACGT ACGTAAAATC 
ATCGTTGCCT GTGACGCCGG TATGGGTTCC AGTGCGATGG GCGCAGGCGT GCTGCGTAAG 
AAAATTCAGG ATGCAGGTCT GTCACAGATT TCGGTCACTA ACAGCGCGAT CAACAACCTG 
CCGCCAGATG TGGACCTCGT CATCACTCAC CGTGACCTGA CCGAACGCGC TATGCGCCAG 
GTTCCGCAGG CGCAGCATAT TTCGCTGACC AACTTCCTCG ACAGCGGCCT GTACACCAGC 
CTAACCGAAC GTCTGGTTGC TGCCCAGCGC CATACTGAAA ACGAAGTGAA AGTGAAAGAC 
AGTCTGAAAG ACAGCTTTGA CGATTCCAGT GCTAACCTGT TCAAACTGGG CGCGGAGAAC 
ATCTTCCTCG GTCGCAAAGC AGCAACCAAA GAAGAAGCGA TTCGTTTTGC TGGCGAGCAG 
CTGGTGAAAG GCGGTTACGT TGAGCCGGAA TACGTTCAGG CGATGCTGGA TCGTGAAAAA 
CTGACCCCGA CTTATCTGGG TGAGTCTATC GCGGTGCCAC ACGGTACGGT TGAAGCGAAA 
GATCGCGTAC TGAAAACGGG CGTGGTGTTC TGCCAGTACC CGGAAGGCGT GCGCTTCGGT 
GAAGAAGAAG ATGACATTGC CCGTCTGGTG ATTGGTATTG CAGCCCGTAA CAACGAGCAC 
ATTCAGGTTA TCACCAGCCT GACCAATGCA CTGGATGATG AGTCCGTCAT CGAGCGTCTG 
GCACACACCA CCAGCGTGGA TGAAGTGCTG GAACTGTTGG CAGGTCGTAA GTAA

Protein sequence

MSSDIKIKVQ SFGRFLSNMV MPNIGAFIAW GIITALFIPT GWLPNETLAK LVGPMITYLL 
PLLIGYTGGK LVGGERGGVV GAITTMGVIV GADMPMFLGS MIAGPLGGWC IKHFDRWVDG 
KIKSGFEMLV NNFSAGIIGM ILAILAFLGI GPIVEALSKM LAAGVNFMVV HDMLPLASIF 
VEPAKILFLN NAINHGIFSP LGIQQSHELG KSIFFLIEAN PGPGMGVLLA YMFFGRGSAK 
QSAGGAAIIH FLGGIHEIYF PYVLMNPRLI LAVILGGMTG VFTLTILGGG LVSPASPGSI 
LAVLAMTPKG AYFANIAGVC AAMAVSFVVS AILLKTSKVK EEDDIEAATR RMQDMKAESK 
GTSPLSAGDV TNDLSHVRKI IVACDAGMGS SAMGAGVLRK KIQDAGLSQI SVTNSAINNL 
PPDVDLVITH RDLTERAMRQ VPQAQHISLT NFLDSGLYTS LTERLVAAQR HTENEVKVKD 
SLKDSFDDSS ANLFKLGAEN IFLGRKAATK EEAIRFAGEQ LVKGGYVEPE YVQAMLDREK 
LTPTYLGESI AVPHGTVEAK DRVLKTGVVF CQYPEGVRFG EEEDDIARLV IGIAARNNEH 
IQVITSLTNA LDDESVIERL AHTTSVDEVL ELLAGRK