Gene EcHS_A3090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A3090
Symbol
ID	5593241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	3104982
End bp	3106205
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	50%
IMG OID	640922209
Product	PTS system, mannitol-specific cryptic EIICB component, truncation
Protein accession	YP_001459709
Protein GI	157162391
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2213] Phosphotransferase system, mannitol-specific IIBC component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTACCT ATTTATTGCC CGTGATGATT GGTTCTACAG GTGGTCATCT GGTCGGCGGT 
AAACGCGGGG CGGTCATGGG CGGAATAGGT ACTATTGGTG TGATCGTTGG CGCAGAGATC 
CCGATGTTCC TTGGCTCAAT GATCATGGGG CCGCTCGGTG GGTTGGTCAT AAAATATGTC 
GATAAGGCAC TGGAAAAACG CATACCTGCC GGTTTTGAGA TGGTTATCAA TAACTTCTCA 
TTAGGTATCG CGGGGATGCT CCTTTGTCTG CTGGGTTTTG AAGTTATCGG CCCGGCGGTG 
TTAATTGCCA ATACTTTCGT CAAAGAGTGT ATTGAGGCGC TGGTACATGC GGGTTATCTG 
CCATTGTTGT CAGTCATCAA TGAACCGGCG AAAGTGCTTT TCCTCAATAA TGCGATCGAT 
CAGGGCGTCT ATTATCCGCT GGGAATGCAA CAGGCTTCGG TTAACGGTAA ATCCATCTTC 
TTTATGGTGG CCTCTAACCC AGGTCCGGGC CTGGGGCTGC TGCTGGCGTT TACCTTGTTT 
GGTAAAGGGA TGAGTAAACG TTCTGCGCCC GGGGCGATGA TTATTCACTT CCTCGGTGGG 
ATCCACGAAC TGTATTTCCC GTATGTGCTG ATGAAGCCGC TGACCATTAT TGCCATGATT 
GCGGGCGGTA TGTCTGGCAC CTGGATGTTT AACTTACTGG ACGGTGGTCT GGTGGCTGGC 
CCAAGTCCGG GGTCTATCTT TGCTTACCTG GCACTGACGC CGAAAGGCTC GTTCCTGGCG 
ACAATTGCCG GTGTTACGGT AGGTACCCTG GTGTCCTTTG CTATTACTTC GCTGATACTG 
AAGATGGAAA AAACGGTGGA AACGGAGAGC GAAGATGAGT TTGCTCAGTC AGCCAATGCG 
GTTAAGGCGA TGAAACAAGA GGGTGCATTC TCGTTAAGCA GGGTTAAGCG TATCGCCTTT 
GTTTGCGATG CGGGGATGGG CTCCAGTGCG ATGGGCGCGA CCACCTTCCG TAAACGCCTG 
GAAAAAGCGG GGCTGGCAAT TGAAGTAAAA CATTACGCCA TAGAAAACGT GCCTGCGGAT 
GCGGATATCG TCGTTACTCA TGCCAGTCTG GAAGGGCGCG TGAAACGTGT GACGGATAAA 
CCACTGATAT TGATTAATAA CTATATTGGC GATCCAAAAC TCGACACTTT ATTTAATCAA 
TTAACCGCCG AACATAAACA CTGA

Protein sequence

MITYLLPVMI GSTGGHLVGG KRGAVMGGIG TIGVIVGAEI PMFLGSMIMG PLGGLVIKYV 
DKALEKRIPA GFEMVINNFS LGIAGMLLCL LGFEVIGPAV LIANTFVKEC IEALVHAGYL 
PLLSVINEPA KVLFLNNAID QGVYYPLGMQ QASVNGKSIF FMVASNPGPG LGLLLAFTLF 
GKGMSKRSAP GAMIIHFLGG IHELYFPYVL MKPLTIIAMI AGGMSGTWMF NLLDGGLVAG 
PSPGSIFAYL ALTPKGSFLA TIAGVTVGTL VSFAITSLIL KMEKTVETES EDEFAQSANA 
VKAMKQEGAF SLSRVKRIAF VCDAGMGSSA MGATTFRKRL EKAGLAIEVK HYAIENVPAD 
ADIVVTHASL EGRVKRVTDK PLILINNYIG DPKLDTLFNQ LTAEHKH