Gene EcSMS35_1031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1031
Symbol	gnd
ID	6143451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1051833
End bp	1053239
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID	641615918
Product	6-phosphogluconate dehydrogenase
Protein accession	YP_001743110
Protein GI	170683458
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0362] 6-phosphogluconate dehydrogenase
TIGRFAM ID	[TIGR00873] 6-phosphogluconate dehydrogenase, decarboxylating

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.715181
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAAGC AACAGATCGG CGTAATCGGT ATGGCAGTGA TGGGGCGCAA CCTTGCGCTC 
AACATCGAAA GCCGTGGTTA TACCGTCTCT ATTTTCAACC GTTCCCGTGA AAAGACGGAA 
GAAGTGATTG CCGAAAATCC AGGCAAGAAA CTGGTTCCTT ACTATACGGT GAAAGAGTTT 
GTTGAATCTC TGGAAACGCC TCGTCGCATC CTGTTAATGG TGAAAGCAGG TGCTGGCACG 
GATGCTGCTA TTGATTCCAT CAAGCCGTAC CTCGATAAAG GTGACATCAT CATTGATGGT 
GGTAATACAT TCTTCCAGGA CACCATTCGC CGTAACCGTG AGCTTTCTGC CGAAGGCTTT 
AACTTCATCG GTACCGGTGT TTCCGGTGGT GAAGAGGGCG CGCTGAAAGG GCCTTCCATC 
ATGCCTGGTG GGCAGAAAGA AGCCTATGAA CTGGTTGCGC CGATCCTGAC CAAAATCGCA 
GCCGTTGCTG AAGATGGCGA ACCGTGCGTT ACCTATATTG GTACCGATGG CGCAGGTCAC 
TATGTGAAGA TGGTTCACAA CGGTATTGAA TATGGCGATA TGCAGCTGAT TGCTGAAGCC 
TATTCTCTGC TTAAAGGTGG CCTGAACCTC ACTAACGAAG AACTGGCGCA GACCTTTACC 
GAGTGGAATA ACGGTGAACT GAGCAGCTAC CTGATTGACA TCACTAAAGA CATCTTCACT 
AAAAAAGATG AAGACGGTAA CTACCTGGTT GATGTGATTC TGGATGAAGC GGCTAACAAA 
GGTACCGGTA AATGGACCAG CCAGAGCGCG CTGGATCTCG GTGAACCGCT GTCGCTGATT 
ACCGAGTCTG TGTTTGCACG TTATATCTCT TCTCTGAAAG ATCAGCGTGT TGCCGCATCT 
AAAGTTCTCT CTGGCCCGCA AGCGCAGCCA GCAGGCGATA AAGATGAGTT CATCGAAAAA 
GTTCGCCGTG CACTGTATCT GGGCAAAATC GTTTCTTACG CTCAGGGCTT CTCTCAACTG 
CGTGCGGCGT CTGAAGAGTA CAACTGGGAT CTGGACTACG GCGAAATCGC GAAGATTTTC 
CGTGCTGGCT GCATCATCCG TGCGCAGTTC CTGCAGAAAA TCACCGATGC TTATGCCGAA 
AATCCGCAGA TCGCTAACCT GCTGCTGGCT CCGTACTTCA AGCAAATCGC CGATGACTAC 
CAGCAGGCGC TGCGCGATGT CGTCGCTTAC GCGGTACAGA ACGGTATCCC GGTTCCGACC 
TTCGCCGCTG CGGTTGCCTA TTATGACAGC TACCGCGCCG CTGTTCTGCC TGCGAACCTG 
ATCCAGGCAC AGCGTGACTA TTTCGGTGCG CATACTTATA AGCGCATTGA TAAAGAAGGT 
GTGTTCCATA CCGAATGGCT GGATTAA

Protein sequence

MSKQQIGVIG MAVMGRNLAL NIESRGYTVS IFNRSREKTE EVIAENPGKK LVPYYTVKEF 
VESLETPRRI LLMVKAGAGT DAAIDSIKPY LDKGDIIIDG GNTFFQDTIR RNRELSAEGF 
NFIGTGVSGG EEGALKGPSI MPGGQKEAYE LVAPILTKIA AVAEDGEPCV TYIGTDGAGH 
YVKMVHNGIE YGDMQLIAEA YSLLKGGLNL TNEELAQTFT EWNNGELSSY LIDITKDIFT 
KKDEDGNYLV DVILDEAANK GTGKWTSQSA LDLGEPLSLI TESVFARYIS SLKDQRVAAS 
KVLSGPQAQP AGDKDEFIEK VRRALYLGKI VSYAQGFSQL RAASEEYNWD LDYGEIAKIF 
RAGCIIRAQF LQKITDAYAE NPQIANLLLA PYFKQIADDY QQALRDVVAY AVQNGIPVPT 
FAAAVAYYDS YRAAVLPANL IQAQRDYFGA HTYKRIDKEG VFHTEWLD