Gene EcolC_1479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1479
Symbol
ID	6067187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1631679
End bp	1632809
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	56%
IMG OID	641600899
Product	bifunctional PTS system fructose-specific transporter subunit IIA/HPr protein
Protein accession	YP_001724469
Protein GI	170019515
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1925] Phosphotransferase system, HPr-related proteins [COG4668] Mannitol/fructose-specific phosphotransferase system, IIA domain
TIGRFAM ID	[TIGR01003] Phosphotransferase System HPr (HPr) Family

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000150472
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000341922
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTCCAGT TATCCGTACA GGACATCCAT CCGGGCGAAA AGGCCGGAGA CAAAGAAGAG 
GCGATTCGCC AGGTCGCTGC GGCGCTGGTG CATGCCGGTA ATGTAGCAGA AGGCTACGTC 
AATGGCATGC TGGCGCGCGA GCAGCAAACC TCAACGTTCC TCGGCAATGG TATTGCTATT 
CCACACGGCA CCACCGACAC CCGCGATCAG GTGCTGAAAA CGGGCGTTCA GGTATTTCAG 
TTCCCGGAAG GCGTCACCTG GGGTGACGGT CAGGTAGCGT ACGTGGCGAT CGGTATTGCT 
GCCAGCTCGG ATGAACATCT GGGCCTGCTA CGCCAGCTGA CCCACGTACT GAGCGATGAT 
TCCGTTGCTG AACAACTGAA GTCAGCAACA ACAGCAGAAG AACTTCGCGC ATTGCTGATG 
GGCGAAAAGC AGAGTGAGCA GCTGAAGCTC GACAACGAAA TGCTGACGCT GGATATCGTC 
GCCAGCGATC TGCTGACTCT TCAGGCGCTG AACGCTGCGC GTCTGAAAGA GGCGGGGGCA 
GTTGACGCCA CTTTCGTCAC CAAAGCCATC AATGAACAAC CGCTGAACCT CGGACAGGGT 
ATCTGGCTGA GCGATAGCGC CGAAGGCAAT CTGCGTAGCG CGATTGCGGT AAGCCGTGCG 
GCAAATGCTT TTGATGTGGA CGGCGAAACG GCAGCCATGC TGGTGAGTGT GGCGATGAAT 
GACGATCAGC CCCTCGCGGT TCTTAAGCGT CTCGCTGATT TGTTGCTCGA CAATAAAGCT 
GACCGCTTGC TGAAAGCGGA TGCGGCAACG TTGCTGGCGC TGCTGACCAG CGATGATGCG 
CCGACCGACG ACGTGTTAAG CGCGGAGTTT GTGGTGCGCA ATGAACACGG CCTGCATGCT 
CGTCCAGGTA CCATGCTGGT CAATACCATT AAACAATTTA ACAGTGATAT TACCGTGACA 
AACCTTGATG GCACCGGCAA ACCGGCAAAC GGACGTAGTC TGATGAAAGT TGTGGCACTT 
GGCGTTAAGA AAGGTCATCG CCTACGCTTT ACCGCCCAGG GTGCAGATGC TGAACAGGCG 
CTGAAAGCAA TCGGCGACGC TATCGCTGCT GGTCTTGGGG AGGGCGCATA A

Protein sequence

MFQLSVQDIH PGEKAGDKEE AIRQVAAALV HAGNVAEGYV NGMLAREQQT STFLGNGIAI 
PHGTTDTRDQ VLKTGVQVFQ FPEGVTWGDG QVAYVAIGIA ASSDEHLGLL RQLTHVLSDD 
SVAEQLKSAT TAEELRALLM GEKQSEQLKL DNEMLTLDIV ASDLLTLQAL NAARLKEAGA 
VDATFVTKAI NEQPLNLGQG IWLSDSAEGN LRSAIAVSRA ANAFDVDGET AAMLVSVAMN 
DDQPLAVLKR LADLLLDNKA DRLLKADAAT LLALLTSDDA PTDDVLSAEF VVRNEHGLHA 
RPGTMLVNTI KQFNSDITVT NLDGTGKPAN GRSLMKVVAL GVKKGHRLRF TAQGADAEQA 
LKAIGDAIAA GLGEGA