Gene EcolC_4119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4119
Symbol
ID	6066001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4544375
End bp	4545445
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	52%
IMG OID	641603541
Product	putative fructose-specific phosphotransferase system protein FrvX
Protein accession	YP_001727044
Protein GI	170022090
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATTG AGTTACTGCA ACAGTTGTGC GAAGCCAGCG CCGTCAGCGG CGATGAACAG 
GAAGTTCGCG ACATTCTGAT AAACACGCTG GAACCTTGCG TGAATGAAAT CACCTTCGAT 
GGTCTGGGCA GCTTTGTTGC CCGTAAGGGG AATAAAGGTC CAAAAGTTGC CGTTGTCGGA 
CATATGGATG AAGTCGGCTT TATGGTCACC CACATCGACG AGAGCGGTTT TCTGCGTTTT 
ACCACCATTG GCGGCTGGTG GAATCAGTCG ATGCTCAACC ACCGGGTAAC CATACGCACA 
CACAAGGGAG TGAAAATCCC TGGTGTGATT GGTTCCGTCG CGCCTCATGC GTTAACGGAA 
AAGCAAAAGC AACAACCGCT GTCATTTGAT GAGATGTTCA TTGATATTGG CGCGAACAGT 
CGCGAAGAGG TGGAAAAGCG CGGCGTGGAA ATTGGTAATT TTATTAGCCC GGAAGCCAAT 
TTTGCCTGCT GGGGCGAAGA TAAAGTGGTC GGCAAGGCGT TGGATAACCG CATCGGCTGC 
GCAATGATGG CTGAACTATT GCAGACGGTG AATAATCCCG AAATTACGCT GTATGGCGTT 
GGCAGTGTGG AAGAAGAAGT TGGGCTACGC GGGGCGCAAA CCTCGGCGGA ACACATTAAA 
CCGGACGTCG TGATCGTGTT GGATACCGCC GTAGCGGGCG ATGTTCCGGG CATTGATAAC 
ATTAAATACC CGCTGAAACT GGGCCAGGGG CCGGGGCTGA TGCTGTTTGA CAAGCGCTAC 
TTCCCCAACC AGAAACTGGT AGCAGCGTTA AAAAGCTGTG CCGCACATAA CGATTTACCG 
CTGCAATTTT CCACCATGAA AACCGGTGCG ACGGATGGCG GGCGCTACAA CGTGATGGGC 
GGCGGGCATC CGGTTGTCGC GCTGTGTCTG CCAACTCGTT ATCTGCACGC CAACAGCGGT 
ATGATTTCAA AAGCCGATTA CGAAGCTCTG CTCACGCTGA TACGGGGTTT TCTGACGACC 
TTAACTGCGG AGAAAGTCAA CGCGTTTAGC CAGTTCCGTC AGGTGGATTA A

Protein sequence

MNIELLQQLC EASAVSGDEQ EVRDILINTL EPCVNEITFD GLGSFVARKG NKGPKVAVVG 
HMDEVGFMVT HIDESGFLRF TTIGGWWNQS MLNHRVTIRT HKGVKIPGVI GSVAPHALTE 
KQKQQPLSFD EMFIDIGANS REEVEKRGVE IGNFISPEAN FACWGEDKVV GKALDNRIGC 
AMMAELLQTV NNPEITLYGV GSVEEEVGLR GAQTSAEHIK PDVVIVLDTA VAGDVPGIDN 
IKYPLKLGQG PGLMLFDKRY FPNQKLVAAL KSCAAHNDLP LQFSTMKTGA TDGGRYNVMG 
GGHPVVALCL PTRYLHANSG MISKADYEAL LTLIRGFLTT LTAEKVNAFS QFRQVD