Gene ECH74115_3305 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3305
Symbol	fruB
ID	6966875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3038656
End bp	3039786
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	56%
IMG OID	643387117
Product	bifunctional PTS system fructose-specific transporter subunit IIA/HPr protein
Protein accession	YP_002271581
Protein GI	209400685
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1925] Phosphotransferase system, HPr-related proteins [COG4668] Mannitol/fructose-specific phosphotransferase system, IIA domain
TIGRFAM ID	[TIGR01003] Phosphotransferase System HPr (HPr) Family

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000017486
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0105453
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCCAGT TATCCGTACA GGACATCCAT CCGGGCGAAA AGGCCGGAGA CAAAGAAGAG 
GCGATTCGCC AGGTCGCTGC GGCGCTGGTG CAGGCCGGTA ATGTAGCAGA AGGCTACGTC 
AATGGCATGC TGGCGCGCGA ACAGCAAACC TCAACGTTCC TCGGCAATGG TATTGCTATT 
CCACACGGCA CTACCGACAC CCGCGATCAG GTGCTGAAAA CCGGCGTTCA GGTATTTCAG 
TTCCCGGAAG GCGTCACCTG GGGTGACGGT CAGGTAGCGT ACGTAGCGAT CGGTATTGCT 
GCCAGCTCGG ATGAGCATCT GGGCCTGCTA CGCCAGCTGA CCCACGTACT GAGCGATGAT 
TCCGTTGCTG AACAACTGAA GTCAGCAACA ACAGCAGAAG AACTTCGCGC ATTGCTGATG 
GGCGAAAAGC AGAGTGAGCA GCTGAAGCTC GACAACGAAA TGCTGACGCT GGATATCGTC 
GCCAGCGATC TGCTGACTCT TCAGGCGCTG AACGCTGCGC GTCTGAAAGA GGCGGGGGCA 
GTTGACGCCA CTTTCGTCAC CAAAGCCATC AATGAACAAC CGCTGAACCT CGGACAGGGT 
ATCTGGCTGA GCGATAGCGC CGAAGGCAAT CTGCGTAGCG CAATTGCGGT AAGCCGTGCG 
GCAAATGCTT TTGATGTGGA CGGCGAAACG GCAGCCATGC TGGTGAGTGT GGCGATGAAT 
GACGATCAGC CCATTGCGGT TCTTAAGCGT CTCGCTGATT TGTTGCTCGA CAATAAAGCT 
GACCGCTTGC TGAAAGCGGA TGCGGCAACG TTGCTGGCGC TGCTGACCAG CGATGATGCG 
CCGACCGACG ACGTGTTAAG CGCGGAGTTT GTGGTGCGCA ATGAACACGG CCTGCATGCT 
CGTCCAGGTA CCATGCTGGT CAACACCATT AAACAATTTA ACAGTGATAT TACCGTGACA 
AACCTTGATG GCACCGGCAA ACCGGCAAAC GGACGTAGTC TGATGAAAGT TGTGGCACTT 
GGCGTTAAGA AAGGTCATCG CCTACGCTTT ACCGCCCAGG GTGCAGATGC TGAACAGGCG 
CTGAAAGCAA TCGGCGACGC TATCGCTGCT GGTCTTGGGG AGGGCGCATA A

Protein sequence

MFQLSVQDIH PGEKAGDKEE AIRQVAAALV QAGNVAEGYV NGMLAREQQT STFLGNGIAI 
PHGTTDTRDQ VLKTGVQVFQ FPEGVTWGDG QVAYVAIGIA ASSDEHLGLL RQLTHVLSDD 
SVAEQLKSAT TAEELRALLM GEKQSEQLKL DNEMLTLDIV ASDLLTLQAL NAARLKEAGA 
VDATFVTKAI NEQPLNLGQG IWLSDSAEGN LRSAIAVSRA ANAFDVDGET AAMLVSVAMN 
DDQPIAVLKR LADLLLDNKA DRLLKADAAT LLALLTSDDA PTDDVLSAEF VVRNEHGLHA 
RPGTMLVNTI KQFNSDITVT NLDGTGKPAN GRSLMKVVAL GVKKGHRLRF TAQGADAEQA 
LKAIGDAIAA GLGEGA