Gene EcHS_A4126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4126
Symbol
ID	5593413
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4118048
End bp	4119118
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	53%
IMG OID	640923229
Product	putative fructose-specific phosphotransferase system protein FrvX
Protein accession	YP_001460688
Protein GI	157163370
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATTG AGTTACTGCA ACAGTTGTGC GAAGCCAGCG CCGTCAGCGG CGATGAACAG 
GAAGTTCGCG ACATTCTGAT AAACACGCTG GAACCTTGCG TGAATGAAAT CACCTTCGAT 
GGTCTGGGCA GCTTTGTTGC CCGTAAGGGG AATAAAGGTC CAAAAGTTGC CGTTGTCGGA 
CATATGGATG AAGTCGGCTT TATGGTCACC CACATCGACG AGAGCGGTTT TCTGCGTTTT 
ACCACCATTG GCGGCTGGTG GAATCAGTCG ATGCTCAACC ACCGGGTAAC CATACGCACA 
CACAAGGGAG TGAAAATCCC TGGTGTGATT GGTTCCGTCG CGCCTCATGC GTTAACGGAA 
AAGCAAAAGC AACAACCGCT GTCATTTGAT GAGATGTTCA TTGATATTGG CGCGAACAGT 
CGCGAAGAGG TGGAAAAGCG CGGCGTGGAA ATTGGTAATT TTATTAGCCC GGAAGCCAAT 
TTTGCCTGCT GGGGCGAAGA TAAAGTGGTC GGCAAGGCGT TGGATAACCG CATCGGCTGC 
GCAATGATGG CTGAACTATT GCAGACGGTG AATAATCCCG AAATTACGCT GTATGGCGTT 
GGCAGTGTGG AAGAAGAAGT TGGGCTACGC GGGGCGCAAA CCTCGGCGGA ACACATTAAA 
CCGGACGTCG TGATCGTGTT GGATACCGCC GTAGCGGGCG ATGTTCCGGG CATTGATAAC 
ATTAAATACC CGCTGAAACT GGGCCAGGGG CCGGGGCTGA TGCTGTTTGA CAAGCGCTAC 
TTCCCCAACC AGAAACTGGT AGCAGCGTTA AAAAGCTGTG CCGCACATAA CGATTTACCG 
CTGCAATTTT CCACCATGAA AACCGGTGCG ACGGATGGCG GGCGCTACAA CGTGATGGGC 
GGCGGGCGTC CGGTTGTCGC GCTGTGTCTG CCAACTCGTT ATCTGCACGC CAACAGCGGT 
ATGATTTCAA AAGCCGATTA CGAAGCTCTG CTCACGCTGA TACGGGGTTT TCTGACGACC 
TTAACTGCGG AGAAAGTCAA CGCGTTTAGC CAGTTCCGTC AGGTGGATTA A

Protein sequence

MNIELLQQLC EASAVSGDEQ EVRDILINTL EPCVNEITFD GLGSFVARKG NKGPKVAVVG 
HMDEVGFMVT HIDESGFLRF TTIGGWWNQS MLNHRVTIRT HKGVKIPGVI GSVAPHALTE 
KQKQQPLSFD EMFIDIGANS REEVEKRGVE IGNFISPEAN FACWGEDKVV GKALDNRIGC 
AMMAELLQTV NNPEITLYGV GSVEEEVGLR GAQTSAEHIK PDVVIVLDTA VAGDVPGIDN 
IKYPLKLGQG PGLMLFDKRY FPNQKLVAAL KSCAAHNDLP LQFSTMKTGA TDGGRYNVMG 
GGRPVVALCL PTRYLHANSG MISKADYEAL LTLIRGFLTT LTAEKVNAFS QFRQVD