Gene EcHS_A2304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2304
Symbol	fruA
ID	5591230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2301897
End bp	2303588
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	56%
IMG OID	640921430
Product	PTS system fructose-specific transporter subunits IIBC
Protein accession	YP_001458966
Protein GI	157161648
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1299] Phosphotransferase system, fructose-specific IIC component [COG1445] Phosphotransferase system fructose-specific component IIB
TIGRFAM ID	[TIGR00829] PTS system, fructose-specific, IIB component [TIGR01427] PTS system, fructose subfamily, IIC component

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.000200462
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACGC TGCTGATTAT TGACGCTAAT CTCGGTCAGG CACGCGCCTA TATGGCGAAG 
ACCCTGCTGG GCGCGGCGGC GCGAAAAGCA AAACTGGAAA TCATCGACAA TCCGAACGAC 
GCTGAAATGG CGATTGTTCT CGGTGATTCC ATCCCGAATG ACAGCGCGCT GAACGGTAAA 
AATGTCTGGC TGGGTGATAT TTCCCGGGCA GTTGCGCACC CTGAGCTGTT CCTGAGTGAA 
GCCAAAGGCC ATGCGAAACC TTACACTGCG CTGGTCACTG CGACAGCACC GGTTGCCGCC 
AGCGGTCCGA AACGCGTAGT TGCGGTGACT GCTTGCCCGA CTGGCGTAGC ACACACCTTT 
ATGGCGGCTG AAGCCATTGA AACCGAAGCG AAAAAACGTG GCTGGTGGGT GAAAGTTGAA 
ACCCGTGGTT CTGTTGGCGC GGGTAATGCA ATCACTCCCG AGGAAGTAGC CGCAGCGGAT 
CTGGTGATTG TGGCGGCAGA TATCGAAGTG GATCTGGCGA AATTTGCTGG TAAACCGATG 
TATCGTACCT CTACCGGTCT GGCGCTGAAG AAAACCGCGC AGGAACTGGA TAAAGCGGTT 
GCTGAAGCAA CGCCGTATGA ACCGGCGGGC AAAGCTCAAA CGGCGACCAC TGAAGGTAAG 
AAAGAGAGTG CAGGCGCTTA TCGTCACTTG CTAACGGGCG TCTCTTACAT GCTGCCGATG 
GTCGTTGCTG GTGGTCTGTG TATCGCGCTT TCTTTTGCTT TTGGTATCGA AGCGTTTAAA 
GAGCCGGGTA CGTTGGCAGC GGCGCTGATG CAGATTGGTG GTGGTTCAGC CTTTGCGCTG 
ATGGTGCCGG TACTGGCAGG TTATATTGCC TTTTCCATTG CCGATCGTCC GGGCCTCACG 
CCGGGTCTGA TTGGCGGTAT GCTGGCGGTC AGCACCGGTT CTGGCTTCAT TGGCGGTATT 
ATTGCGGGCT TCCTGGCTGG TTACATTGCG AAGTTAATCA GTACGCAACT GAAACTGCCA 
CAGAGTATGG AGGCGCTGAA ACCAATCCTG ATCATTCCGC TAATTTCCAG TCTGGTGGTC 
GGTCTGGCGA TGATCTACCT GATCGGTAAA CCGGTTGCTG GCATTCTCGA AGGGCTGACT 
CACTGGCTGC AGACCATGGG GACTGCGAAT GCGGTTCTGC TGGGGGCGAT CCTCGGTGGC 
ATGATGTGTA CTGACATGGG CGGTCCGGTA AACAAAGCAG CGTACGCATT CGGTGTGGGT 
CTGCTGAGTA CTCAAACCTA TGGCCCGATG GCGGCGATTA TGGCGGCAGG TATGGTGCCA 
CCGCTGGCAA TGGGTCTGGC AACAATGGTG GCGCGTCGCA AATTCGACAA AGCGCAGCAG 
GAAGGTGGCA AAGCCGCTCT GGTATTGGGA CTGTGCTTCA TTTCGGAAGG TGCAATTCCG 
TTTGCTGCTC GTGATCCGAT GCGTGTGCTG CCGTGCTGTA TCGTGGGTGG TGCGCTGACT 
GGCGCAATCT CAATGGCGAT TGGTGCGAAA CTGATGGCAC CACACGGTGG TCTGTTTGTT 
CTGCTGATCC CTGGCGCTAT TACGCCGGTA CTGGGTTACC TGGTAGCAAT TATTGCCGGT 
ACGCTGGTGG CGGGTTTGGC CTATGCCTTC CTGAAACGTC CGGAAGTGGA CGCAGTAGCG 
AAAGCAGCGT AA

Protein sequence

MKTLLIIDAN LGQARAYMAK TLLGAAARKA KLEIIDNPND AEMAIVLGDS IPNDSALNGK 
NVWLGDISRA VAHPELFLSE AKGHAKPYTA LVTATAPVAA SGPKRVVAVT ACPTGVAHTF 
MAAEAIETEA KKRGWWVKVE TRGSVGAGNA ITPEEVAAAD LVIVAADIEV DLAKFAGKPM 
YRTSTGLALK KTAQELDKAV AEATPYEPAG KAQTATTEGK KESAGAYRHL LTGVSYMLPM 
VVAGGLCIAL SFAFGIEAFK EPGTLAAALM QIGGGSAFAL MVPVLAGYIA FSIADRPGLT 
PGLIGGMLAV STGSGFIGGI IAGFLAGYIA KLISTQLKLP QSMEALKPIL IIPLISSLVV 
GLAMIYLIGK PVAGILEGLT HWLQTMGTAN AVLLGAILGG MMCTDMGGPV NKAAYAFGVG 
LLSTQTYGPM AAIMAAGMVP PLAMGLATMV ARRKFDKAQQ EGGKAALVLG LCFISEGAIP 
FAARDPMRVL PCCIVGGALT GAISMAIGAK LMAPHGGLFV LLIPGAITPV LGYLVAIIAG 
TLVAGLAYAF LKRPEVDAVA KAA