Gene EcDH1_3972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_3972
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	4279063
End bp	4280712
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	51%
IMG OID
Product	Glucose-6-phosphate isomerase
Protein accession	ACX41572
Protein GI	260451150
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAACA TCAATCCAAC GCAGACCGCT GCCTGGCAGG CACTACAGAA ACACTTCGAT 
GAAATGAAAG ACGTTACGAT CGCCGATCTT TTTGCTAAAG ACGGCGATCG TTTTTCTAAG 
TTCTCCGCAA CCTTCGACGA TCAGATGCTG GTGGATTACT CCAAAAACCG CATCACTGAA 
GAGACGCTGG CGAAATTACA GGATCTGGCG AAAGAGTGCG ATCTGGCGGG CGCGATTAAG 
TCGATGTTCT CTGGCGAGAA GATCAACCGC ACTGAAAACC GCGCCGTGCT GCACGTAGCG 
CTGCGTAACC GTAGCAATAC CCCGATTTTG GTTGATGGCA AAGACGTAAT GCCGGAAGTC 
AACGCGGTGC TGGAGAAGAT GAAAACCTTC TCAGAAGCGA TTATTTCCGG TGAGTGGAAA 
GGTTATACCG GCAAAGCAAT CACTGACGTA GTGAACATCG GGATCGGCGG TTCTGACCTC 
GGCCCATACA TGGTGACCGA AGCTCTGCGT CCGTACAAAA ACCACCTGAA CATGCACTTT 
GTTTCTAACG TCGATGGGAC TCACATCGCG GAAGTGCTGA AAAAAGTAAA CCCGGAAACC 
ACGCTGTTCT TGGTAGCATC TAAAACCTTC ACCACTCAGG AAACTATGAC CAACGCCCAT 
AGCGCGCGTG ACTGGTTCCT GAAAGCGGCA GGTGATGAAA AACACGTTGC AAAACACTTT 
GTGGCGCTTT CCACCAATGC CAAAGCCGTT GGCGAGTTTG GTATTGATAC TGCCAACATG 
TTCGAGTTCT GGGACTGGGT TGGCGGCCGT TACTCTTTGT GGTCAGCGAT TGGCCTGTCG 
ATTGTTCTCT CCATCGGCTT TGATAACTTC GTTGAACTGC TTTCCGGCGC ACACGCGATG 
GACAAGCATT TCTCCACCAC GCCTGCCGAG AAAAACCTGC CTGTACTGCT GGCGCTGATT 
GGCATCTGGT ACAACAATTT CTTTGGTGCG GAAACTGAAG CGATTCTGCC GTATGACCAG 
TATATGCACC GTTTCGCGGC GTACTTCCAG CAGGGCAATA TGGAGTCCAA CGGTAAGTAT 
GTTGACCGTA ACGGTAACGT TGTGGATTAC CAGACTGGCC CGATTATCTG GGGTGAACCA 
GGCACTAACG GTCAGCACGC GTTCTACCAG CTGATCCACC AGGGAACCAA AATGGTACCG 
TGCGATTTCA TCGCTCCGGC TATCACCCAT AACCCGCTCT CTGATCATCA CCAGAAACTG 
CTGTCTAACT TCTTCGCCCA GACCGAAGCG CTGGCGTTTG GTAAATCCCG CGAAGTGGTT 
GAGCAGGAAT ATCGTGATCA GGGTAAAGAT CCGGCAACGC TTGACTACGT GGTGCCGTTC 
AAAGTATTCG AAGGTAACCG CCCGACCAAC TCCATCCTGC TGCGTGAAAT CACTCCGTTC 
AGCCTGGGTG CGTTGATTGC GCTGTATGAG CACAAAATCT TTACTCAGGG CGTGATCCTG 
AACATCTTCA CCTTCGACCA GTGGGGCGTG GAACTGGGTA AACAGCTGGC GAACCGTATT 
CTGCCAGAGC TGAAAGATGA TAAAGAAATC AGCAGCCACG ATAGCTCGAC CAATGGTCTG 
ATTAACCGCT ATAAAGCGTG GCGCGGTTAA

Protein sequence

MKNINPTQTA AWQALQKHFD EMKDVTIADL FAKDGDRFSK FSATFDDQML VDYSKNRITE 
ETLAKLQDLA KECDLAGAIK SMFSGEKINR TENRAVLHVA LRNRSNTPIL VDGKDVMPEV 
NAVLEKMKTF SEAIISGEWK GYTGKAITDV VNIGIGGSDL GPYMVTEALR PYKNHLNMHF 
VSNVDGTHIA EVLKKVNPET TLFLVASKTF TTQETMTNAH SARDWFLKAA GDEKHVAKHF 
VALSTNAKAV GEFGIDTANM FEFWDWVGGR YSLWSAIGLS IVLSIGFDNF VELLSGAHAM 
DKHFSTTPAE KNLPVLLALI GIWYNNFFGA ETEAILPYDQ YMHRFAAYFQ QGNMESNGKY 
VDRNGNVVDY QTGPIIWGEP GTNGQHAFYQ LIHQGTKMVP CDFIAPAITH NPLSDHHQKL 
LSNFFAQTEA LAFGKSREVV EQEYRDQGKD PATLDYVVPF KVFEGNRPTN SILLREITPF 
SLGALIALYE HKIFTQGVIL NIFTFDQWGV ELGKQLANRI LPELKDDKEI SSHDSSTNGL 
INRYKAWRG