Gene EcSMS35_4858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4858
Symbol	ptnC
ID	6143529
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	4965184
End bp	4966248
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	49%
IMG OID	641619662
Product	dihydroxyacetone kinase subunit DhaK
Protein accession	YP_001746769
Protein GI	170683691
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2376] Dihydroxyacetone kinase
TIGRFAM ID	[TIGR02363] dihydroxyacetone kinase, DhaK subunit

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAAT TAATTAACCA GATTGATTCT GTTGTCACAG AACAAATGGA AGGACTCATC 
GCCACCTGGC CACACCTGCA GGCAAATTAC GCGCCCCGAT ATGTGTGGTG CAAACAAACC 
GATAATGCAG TGGCGCTGAT TTCAGGCGGC GGCTCAGGCC ATGAACCACT GCATGCAGGT 
TTTGTCGGTA TGGGAATGTT AACCGGTGCA TGTCCTGGTG AAATCTTCAC ATCGCCCACG 
CCAGATCAAA TGATCGAATG TGCCAAAGCG GTTGATAATG GTTCTGGCGT TCTGTTTTTC 
ATCAAAAATT ACACAGGCGA TATTCTGAAT TTCGAAACGG CAGTCGAGAT GTTACACGAA 
GAAGGCATCG CCGTTGGGAC CGTCATTATT GATGATGATG TAGCGGTAAA AGATAGCCTG 
TATACAGCCG GACGTCGCGG TGTTGCGGGT ACAGTTTTTG TTGAAAAGAT TGTCGGTGCG 
GCTGCACTTC AGGGATATAA CCTGGGGCAG TGCGAGCAAC TTGGCAAAGA TGTTAACAAT 
GCCACCCGTT CTTTTGGCAT CGCACTGTCA GCCTGTACGG TTCCCGCCGC GGGAAAACCC 
TCATTTGAAC TGGCTGATAA TGAAATCGAA TTTGGTGTCG GGATCCACGG TGAACCCGGC 
ATTGAACGCC GCACTTTGCA AGATCTGAAC ACTTTAATCG ACAGCGTGAT AGCGCAATTA 
CTGGATAATA CCCCCTGGCG ACGCACATTA CGCCATTGGG ATCGCCATGC GGGGGGATGG 
ATTGACGCAT CATCAATGAA TGAGTCATTC GATCAAAATG CCGAATATAT TGTGTTAATT 
AACGGACTTG GCAGCACGCC TGAATCAGAG TTATATGGTG TGGCCAGGGT ATTTATGTGC 
GCCGCACAGC GCCAGGGAAT TAAAATTAGC CGCCAGTTGG TCGGTAATTA TTGTACATCA 
TTAGATATGG CCGGATTTTC CATCAGCCTG CTGAAATGTA CCCCAGAGTT TTTGCAACTT 
TGGGATGCCC CGGTCAATAC GCCAGCGCTT CGTTGGGGAT GTTAA

Protein sequence

MKKLINQIDS VVTEQMEGLI ATWPHLQANY APRYVWCKQT DNAVALISGG GSGHEPLHAG 
FVGMGMLTGA CPGEIFTSPT PDQMIECAKA VDNGSGVLFF IKNYTGDILN FETAVEMLHE 
EGIAVGTVII DDDVAVKDSL YTAGRRGVAG TVFVEKIVGA AALQGYNLGQ CEQLGKDVNN 
ATRSFGIALS ACTVPAAGKP SFELADNEIE FGVGIHGEPG IERRTLQDLN TLIDSVIAQL 
LDNTPWRRTL RHWDRHAGGW IDASSMNESF DQNAEYIVLI NGLGSTPESE LYGVARVFMC 
AAQRQGIKIS RQLVGNYCTS LDMAGFSISL LKCTPEFLQL WDAPVNTPAL RWGC