Gene EcolC_2428 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2428
Symbol
ID	6064460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	2676493
End bp	2677911
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	50%
IMG OID	641601837
Product	dihydroxyacetone kinase subunit M
Protein accession	YP_001725389
Protein GI	170020435
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01003] Phosphotransferase System HPr (HPr) Family [TIGR02364] dihydroxyacetone kinase, phosphotransfer subunit

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.412819
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.572535
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAAACC TGGTCATAGT TTCACATAGC AGCCGACTGG GAGAAGGTGT CGGTGAATTA 
GCCCGTCAGA TGTTAATGAG TGATAGTTGT AAAATCGCCA TTGCCGCGGG AATTGACGAT 
CCACAAAATC CCATTGGTAC CGATGCCGTC AAAGTGATGG AGGCCATCGA ATCTGTTGCT 
GATGCCGACC ATGTGCTGGT CATGATGGAT ATGGGTAGCG CATTATTGAG TGCTGAAACT 
GCGCTGGAAT TGCTGGCTCC CGAGATCGCC GCAAAAGTAC GTTTGTGTGC TGCGCCGTTG 
GTCGAAGGTA CACTGGCAGC AACGGTCAGC GCGGCCTCGG GGGCGGATAT CGACAAAGTT 
ATCTTTGACG CCATGCATGC GCTGGAAGCC AAACGTGAAC AACTGGGTTT ACCGTCCTCC 
GACACTGAAA TCTCTGACAC ATGTCCTGCG TACGATGAAG AAGCCCGTTC TCTGGCGGTG 
GTCATAAAAA ACCGTAACGG CCTGCATGTA CGTCCGGCCT CCCGGCTGGT TTATACCTTA 
TCGACATTTA ATGCCGATAT GTTGCTGGAA AAAAACGGCA AATGCGTCAC ACCAGAGAGT 
ATTAACCAGA TTGCGTTACT ACAAGTTCGC TATAACGATA CGCTGCGCCT GATTGCGAAA 
GGGCCAGAAG CTGAAGAGGC ACTGATCGCT TTCCGTCAGC TGGCTGAAGA TAACTTTGGT 
GAAACGGAGG AAGTCGCTCC ACCTACTCTG CGTCCCGTTC CGCCTGTTTC GGGTAAAGCC 
TTTTATTATC AACCAGTTTT ATGTACGGTA CAGGCAAAAT CAACCCTGAC CGTGGAAGAA 
GAACAAGATC GATTACGCCA GGCTATTGAC TTCACGTTAT TAGATCTGAT GACGTTAACA 
GCGAAAGCAG AAGCCAGCGG GCTTGACGAT ATTGCCGCAA TCTTTTCTGG TCACCATACA 
CTGTTAGATG ATCCGGAACT GCTGGCGGCG GCAAGCGAAC TCCTTCAGCA TGAACATTGC 
ACGGCAGAAT ATGCCTGGCA GCAAGTTCTT AAAGAACTTA GCCAGCAATA CCAGCAACTG 
GATGATGAAT ATCTACAAGC TCGCTATATT GATGTGGACG ATCTTCTGCA TCGCACCCTG 
GTCCACCTGA CCCAAACGAA AGAAGAACTC CCGCAGTTTA ACTCGCCAAC TATTCTACTG 
GCGGAGAACA TTTATCCTTC CACAGTACTG CAACTGGATC CGGCGGTTGT AAAAGGTATC 
TGCCTTAGCG CCGGAAGTCC GGTATCCCAC AGCGCCCTAA TCGCCCGTGA ACTGGGGATT 
GGCTGGATTT GCCAGCAGGG TGAGAAACTG TATGCGATAC AACCAGAAGA AACGCTAACG 
CTGGACGTTA AAACGCAACG TTTCAACCGT CAGGGTTAA

Protein sequence

MVNLVIVSHS SRLGEGVGEL ARQMLMSDSC KIAIAAGIDD PQNPIGTDAV KVMEAIESVA 
DADHVLVMMD MGSALLSAET ALELLAPEIA AKVRLCAAPL VEGTLAATVS AASGADIDKV 
IFDAMHALEA KREQLGLPSS DTEISDTCPA YDEEARSLAV VIKNRNGLHV RPASRLVYTL 
STFNADMLLE KNGKCVTPES INQIALLQVR YNDTLRLIAK GPEAEEALIA FRQLAEDNFG 
ETEEVAPPTL RPVPPVSGKA FYYQPVLCTV QAKSTLTVEE EQDRLRQAID FTLLDLMTLT 
AKAEASGLDD IAAIFSGHHT LLDDPELLAA ASELLQHEHC TAEYAWQQVL KELSQQYQQL 
DDEYLQARYI DVDDLLHRTL VHLTQTKEEL PQFNSPTILL AENIYPSTVL QLDPAVVKGI 
CLSAGSPVSH SALIARELGI GWICQQGEKL YAIQPEETLT LDVKTQRFNR QG