Gene ECD_01931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_01931
Symbol	gnd
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	1995664
End bp	1997070
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID
Product	6-phosphogluconate dehydrogenase
Protein accession	ACT43782
Protein GI	253978112
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAGC AACAGATCGG CGTCGTCGGT ATGGCAGTGA TGGGGCGCAA CCTTGCGCTC 
AACATCGAAA GCCGTGGTTA TACCGTCTCT ATTTTCAACC GTTCCCGTGA AAAGACGGAA 
GAAGTGATTG CCGAAAATCC AGGCAAGAAA CTGGTTCCTT ACTATACGGT GAAAGAGTTT 
GTTGAATCTC TGGAAACGCC TCGTCGCATC CTGTTAATGG TGAAAGCAGG TGCAGGCACG 
GATGCTGCTA TTGATTCCCT CAAACCATAT CTCGATAAAG GTGACATCAT CATTGATGGT 
GGCAATACCT TCTTCCAGGA CACCATTCGT CGTAACCGTG AACTTTCTGC CGAAGGCTTT 
AACTTCATTG GTACCGGTGT CTCCGGTGGT GAAGAAGGCG CGCTGAAAGG TCCTTCTATT 
ATGCCTGGTG GGCAGAAAGA AGCCTATGAA CTGGTTGCAC CAATCCTGAC CAAAATCGCC 
GCAGTAGCTG AAGACGGGGA GCCATGCGTT ACCTATATTG GTGCCGATGG CGCAGGCCAT 
TATGTGAAGA TGGTTCACAA CGGTATTGAA TACGGCGATA TGCAGCTGAT TGCTGAAGCC 
TATTCTCTGC TTAAAGGTGG CTTGAACCTT TCCAACGAAG AACTGGCGCA GACCTTTACC 
GAGTGGAATA ACGGTGAACT GAGCAGCTAC CTGATTGACA TCACTAAAGA CATCTTCACT 
AAAAAAGATG AAGACGGTAA CTACCTGGTT GATGTGATTC TGGATGAAGC GGCTAACAAA 
GGTACCGGTA AATGGACCAG CCAGAGCGCG CTGGATCTCG GTGAACCGCT GTCGCTGATT 
ACCGAGTCTG TGTTTGCACG TTATATCTCT TCTCTGAAAG ATCAGCGTGT TGCCGCATCT 
AAAGTTCTCT CTGGCCCGCA AGCGCAGCCA GCAGGCGATA AAGATGAGTT CATCGAAAAA 
GTTCGCCGTG CACTGTATCT GGGCAAAATC GTTTCTTACG CTCAGGGCTT CTCTCAACTG 
CGTGCGGCGT CTGAAGAGTA CAACTGGGAT CTGGACTACG GCGAAATCGC GAAGATTTTC 
CGTGCTGGCT GCATCATCCG TGCGCAGTTC CTGCAGAAAA TCACCGATGC TTATGCCGAA 
AATCCGCAGA TCGCTAACCT GCTGCTGGCT CCGTACTTCA AGCAAATCGC CGATGACTAC 
CAGCAGGCGC TGCGCGATGT CGTCGCTTAC GCGGTACAGA ACGGTATCCC GGTTCCGACC 
TTCGCCGCTG CGGTTGCCTA TTATGACAGC TACCGCGCCG CTGTTCTGCC TGCGAACCTG 
ATCCAGGCAC AGCGTGACTA TTTCGGTGCG CATACTTATA AGCGCATTGA TAAAGAAGGT 
GTGTTCCATA CCGAATGGCT GGATTAA

Protein sequence

MSKQQIGVVG MAVMGRNLAL NIESRGYTVS IFNRSREKTE EVIAENPGKK LVPYYTVKEF 
VESLETPRRI LLMVKAGAGT DAAIDSLKPY LDKGDIIIDG GNTFFQDTIR RNRELSAEGF 
NFIGTGVSGG EEGALKGPSI MPGGQKEAYE LVAPILTKIA AVAEDGEPCV TYIGADGAGH 
YVKMVHNGIE YGDMQLIAEA YSLLKGGLNL SNEELAQTFT EWNNGELSSY LIDITKDIFT 
KKDEDGNYLV DVILDEAANK GTGKWTSQSA LDLGEPLSLI TESVFARYIS SLKDQRVAAS 
KVLSGPQAQP AGDKDEFIEK VRRALYLGKI VSYAQGFSQL RAASEEYNWD LDYGEIAKIF 
RAGCIIRAQF LQKITDAYAE NPQIANLLLA PYFKQIADDY QQALRDVVAY AVQNGIPVPT 
FAAAVAYYDS YRAAVLPANL IQAQRDYFGA HTYKRIDKEG VFHTEWLD