Gene ECH74115_2962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2962
Symbol	gnd
ID	6970053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	2736760
End bp	2738166
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	51%
IMG OID	643386802
Product	6-phosphogluconate dehydrogenase
Protein accession	YP_002271270
Protein GI	209400871
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0362] 6-phosphogluconate dehydrogenase
TIGRFAM ID	[TIGR00873] 6-phosphogluconate dehydrogenase, decarboxylating

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0000250075
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCAAAGC AACAGATCGG CGTAGTCGGT ATGGCAGTGA TGGGGCGCAA CCTTGCGCTC 
AACATCGAAA GCCGTGGTTA TACCGTCTCT ATTTTCAACC GTTCCCGTGA AAAGACGGAA 
GAAGTGATTG CCGAAAATCC AGGCAAGAAA CTGGTTCCTT ACTATACGGT GAAAGAATTT 
GTTGAATCTC TGGAAACGCC TCGTCGCATC TTGTTAATGG TGAAAGCAGG TGCAGGCACG 
GATGCTGCTA TTGATTCCCT TAAGCCATAC CTCGATAAAG GTGACATCAT CATTGATGGT 
GGTAATACCT TCTTCCAGGA CACCATTCGT CGTAACCGTG AGCTTTCTGC AGAAGGCTTT 
AACTTCATCG GTACCGGTGT TTCCGGTGGT GAGGAGGGCG CACTAAAAGG TCCTTCCATT 
ATGCCTGGTG GGCAGAAAGA AGCCTATGAA CTAGTTGCGC CGATCCTGAC CAAAATCGCC 
GCAGTGGCTG AAGACGGTGA GCCATGCGTT ACCTATATTG GTGCCGATGG CGCAGGTCAC 
TATGTGAAGA TGGTTCACAA CGGTATTGAA TACGGCGATA TGCAGCTGAT TGCTGAAGCC 
TATTCTCTGC TTAAAGGTGG TCTGAACCTC ACCAACGAAG AACTGGCGCA GATCTTTACC 
GAGTGGAATA ACGGTGAACT GAGCAGCTAC CTGATCGACA TTACCAAAGA CATCTTCACT 
AAAAAAGATG AAGACGGTAA CTACCTGGTT GATGTGATCC TGGATGAAGC GGCAAACAAA 
GGTACGGGCA AATGGACCAG CCAGAGCGCA CTGGATCTCG GCGAACCGCT GTCGCTGATT 
ACCGAGTCTG TGTTTGCACG ATACATCTCT TCTCTGAAAG ATCAGCGCGT TGCTGCGTCT 
AAAGTTCTCT CTGGCCCACA AGCGCAGCCA GCTGGCGACA AGGCTGAGTT CATCGAAAAA 
GTTCGCCGTG CACTGTATCT GGGCAAAATC GTTTCTTACG CTCAGGGGTT CTCTCAACTG 
CGTGCGGCGT CTGAAGAGTA CAACTGGGAT CTGAACTACG GCGAAATCGC GAAGATTTTC 
CGTGCTGGCT GCATCATCCG TGCGCAGTTC CTGCAGAAAA TCACCGATGC TTATGCCGAA 
AATCCGCAGA TCGCTAACCT GCTGCTGGCT CCTTACTTCA AGCAAATTGC CGATGACTAC 
CAGCAGGCGC TGCGCGATGT CGTCGCTTAT GCGGTACAGA ACGGTATCCC GGTTCCGACC 
TTCGCCGCTG CGGTTGCCTA TTATGACAGC TACCGCGCCG CTGTTCTGCC TGCGAACCTG 
ATCCAGGCAC AGCGTGACTA TTTCGGTGCG CATACTTATA AGCGCATTGA TAAAGAAGGT 
GTGTTCCATA CCGAATGGCT GGATTAA

Protein sequence

MSKQQIGVVG MAVMGRNLAL NIESRGYTVS IFNRSREKTE EVIAENPGKK LVPYYTVKEF 
VESLETPRRI LLMVKAGAGT DAAIDSLKPY LDKGDIIIDG GNTFFQDTIR RNRELSAEGF 
NFIGTGVSGG EEGALKGPSI MPGGQKEAYE LVAPILTKIA AVAEDGEPCV TYIGADGAGH 
YVKMVHNGIE YGDMQLIAEA YSLLKGGLNL TNEELAQIFT EWNNGELSSY LIDITKDIFT 
KKDEDGNYLV DVILDEAANK GTGKWTSQSA LDLGEPLSLI TESVFARYIS SLKDQRVAAS 
KVLSGPQAQP AGDKAEFIEK VRRALYLGKI VSYAQGFSQL RAASEEYNWD LNYGEIAKIF 
RAGCIIRAQF LQKITDAYAE NPQIANLLLA PYFKQIADDY QQALRDVVAY AVQNGIPVPT 
FAAAVAYYDS YRAAVLPANL IQAQRDYFGA HTYKRIDKEG VFHTEWLD