Gene B21_01917 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_01917
Symbol	gnd
ID	8113298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	-
Start bp	1994976
End bp	1996382
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID	644848132
Product	hypothetical protein
Protein accession	YP_002999705
Protein GI	251785401
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0362] 6-phosphogluconate dehydrogenase
TIGRFAM ID	[TIGR00873] 6-phosphogluconate dehydrogenase, decarboxylating

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAAAGC AACAGATCGG CGTCGTCGGT ATGGCAGTGA TGGGGCGCAA CCTTGCGCTC 
AACATCGAAA GCCGTGGTTA TACCGTCTCT ATTTTCAACC GTTCCCGTGA AAAGACGGAA 
GAAGTGATTG CCGAAAATCC AGGCAAGAAA CTGGTTCCTT ACTATACGGT GAAAGAGTTT 
GTTGAATCTC TGGAAACGCC TCGTCGCATC CTGTTAATGG TGAAAGCAGG TGCAGGCACG 
GATGCTGCTA TTGATTCCCT CAAACCATAT CTCGATAAAG GTGACATCAT CATTGATGGT 
GGCAATACCT TCTTCCAGGA CACCATTCGT CGTAACCGTG AACTTTCTGC CGAAGGCTTT 
AACTTCATTG GTACCGGTGT CTCCGGTGGT GAAGAAGGCG CGCTGAAAGG TCCTTCTATT 
ATGCCTGGTG GGCAGAAAGA AGCCTATGAA CTGGTTGCAC CAATCCTGAC CAAAATCGCC 
GCAGTAGCTG AAGACGGGGA GCCATGCGTT ACCTATATTG GTGCCGATGG CGCAGGCCAT 
TATGTGAAGA TGGTTCACAA CGGTATTGAA TACGGCGATA TGCAGCTGAT TGCTGAAGCC 
TATTCTCTGC TTAAAGGTGG CTTGAACCTT TCCAACGAAG AACTGGCGCA GACCTTTACC 
GAGTGGAATA ACGGTGAACT GAGCAGCTAC CTGATTGACA TCACTAAAGA CATCTTCACT 
AAAAAAGATG AAGACGGTAA CTACCTGGTT GATGTGATTC TGGATGAAGC GGCTAACAAA 
GGTACCGGTA AATGGACCAG CCAGAGCGCG CTGGATCTCG GTGAACCGCT GTCGCTGATT 
ACCGAGTCTG TGTTTGCACG TTATATCTCT TCTCTGAAAG ATCAGCGTGT TGCCGCATCT 
AAAGTTCTCT CTGGCCCGCA AGCGCAGCCA GCAGGCGATA AAGATGAGTT CATCGAAAAA 
GTTCGCCGTG CACTGTATCT GGGCAAAATC GTTTCTTACG CTCAGGGCTT CTCTCAACTG 
CGTGCGGCGT CTGAAGAGTA CAACTGGGAT CTGGACTACG GCGAAATCGC GAAGATTTTC 
CGTGCTGGCT GCATCATCCG TGCGCAGTTC CTGCAGAAAA TCACCGATGC TTATGCCGAA 
AATCCGCAGA TCGCTAACCT GCTGCTGGCT CCGTACTTCA AGCAAATCGC CGATGACTAC 
CAGCAGGCGC TGCGCGATGT CGTCGCTTAC GCGGTACAGA ACGGTATCCC GGTTCCGACC 
TTCGCCGCTG CGGTTGCCTA TTATGACAGC TACCGCGCCG CTGTTCTGCC TGCGAACCTG 
ATCCAGGCAC AGCGTGACTA TTTCGGTGCG CATACTTATA AGCGCATTGA TAAAGAAGGT 
GTGTTCCATA CCGAATGGCT GGATTAA

Protein sequence

MSKQQIGVVG MAVMGRNLAL NIESRGYTVS IFNRSREKTE EVIAENPGKK LVPYYTVKEF 
VESLETPRRI LLMVKAGAGT DAAIDSLKPY LDKGDIIIDG GNTFFQDTIR RNRELSAEGF 
NFIGTGVSGG EEGALKGPSI MPGGQKEAYE LVAPILTKIA AVAEDGEPCV TYIGADGAGH 
YVKMVHNGIE YGDMQLIAEA YSLLKGGLNL SNEELAQTFT EWNNGELSSY LIDITKDIFT 
KKDEDGNYLV DVILDEAANK GTGKWTSQSA LDLGEPLSLI TESVFARYIS SLKDQRVAAS 
KVLSGPQAQP AGDKDEFIEK VRRALYLGKI VSYAQGFSQL RAASEEYNWD LDYGEIAKIF 
RAGCIIRAQF LQKITDAYAE NPQIANLLLA PYFKQIADDY QQALRDVVAY AVQNGIPVPT 
FAAAVAYYDS YRAAVLPANL IQAQRDYFGA HTYKRIDKEG VFHTEWLD