Gene EcE24377A_4428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_4428
Symbol
ID	5586970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	4417737
End bp	4418807
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	640928043
Product	putative fructose-specific phosphotransferase system protein FrvX
Protein accession	YP_001465387
Protein GI	157157925
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATTG AGTTACTGCA ACAGTTGTGC GAAGCCAGCG CCGTCAGCGG CGATGAACAG 
GAAGTTCGCG ACATCCTGAT AAACACGCTG GAACCTTGCG TTAATGAAAT CACCTTTGAT 
GGTCTGGGCA GCTTTGTTGC CCGTAAGGGG AATAAAGGTC CAAAAGTTGC CGTTGTCGGG 
CATATGGATG AAGTCGGCTT TATGGTCACC CACATCGACG AGAGCGGTTT TCTGCGCTTC 
ACCACCATTG GCGGCTGGTG GAATCAGTCG ATGCTCAACC ACCGGGTAAC CATACGCACA 
CACAAGGGAT TTAAAATCCC TGGTGTGATT GGTTCCGTCG CGCCTCATGC GTTAACGGAA 
AAGCAAAAGC AACAACCGCT GTCATTTGAT GAGATGTTCA TTGATATTGG CGCGAACAGT 
CGCGAAGAAG CGGAAAAGCG CGGCGTTGAA ATTGGCGATT TTATTAGCCC GGAAGCCAAT 
TTTGCCTGCT GGGGCGAAGA TAAAGTAGTC GGAAAGGCGC TGGATAACCG CATCGGCTGC 
GCGATGATGG CGGAGCTACT ACAGACAGTA AATAACCCAG AAATTACGCT GTACGGCGTT 
GGCAGTGTGG AAGAAGAAGT TGGGCTACGC GGGGCACAAA CCTCGGCGGA ACACATTAAA 
CCGGATGTGG TGATTGTGCT GGATACCGCT GTCGCAGGTG ATGTTCCGGG CATTGATAAC 
ATTAAATACC CGCTGAAACT GGGCCAGGGG CCGGGGCTGA TGCTGTTTGA CAAGCGCTAC 
TTCCCCAACC AGAAACTGGT AGCAGTGTTA AAAAACTGTG CCGCACATAA CGATTTACCG 
CTGCAATTTT CCACCATGAA AACCGGAGCG ACGGATGGCG GGCGCTACAA CGTGATGGGC 
GGCGGGCGTC CGGTTGTCGC GCTGTGTCTG CCAACTCGTT ATCTGCACGC TAACAGCGGC 
ATGATTTCAA AAGCCGATTA CGATGCTCTG CTCACGCTGA TACGGGATTT TCTGACGACC 
TTAACTGCGG AGAAAGTCAA CGCGTTTAGC CAGTTCCGTC AGGTGGATTA A

Protein sequence

MNIELLQQLC EASAVSGDEQ EVRDILINTL EPCVNEITFD GLGSFVARKG NKGPKVAVVG 
HMDEVGFMVT HIDESGFLRF TTIGGWWNQS MLNHRVTIRT HKGFKIPGVI GSVAPHALTE 
KQKQQPLSFD EMFIDIGANS REEAEKRGVE IGDFISPEAN FACWGEDKVV GKALDNRIGC 
AMMAELLQTV NNPEITLYGV GSVEEEVGLR GAQTSAEHIK PDVVIVLDTA VAGDVPGIDN 
IKYPLKLGQG PGLMLFDKRY FPNQKLVAVL KNCAAHNDLP LQFSTMKTGA TDGGRYNVMG 
GGRPVVALCL PTRYLHANSG MISKADYDAL LTLIRDFLTT LTAEKVNAFS QFRQVD