Gene EcDH1_0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_0032
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	+
Start bp	30978
End bp	32666
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	56%
IMG OID
Product	acetolactate synthase, large subunit, biosynthetic type
Protein accession	ACX37730
Protein GI	260447308
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	80
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGTT CGGGCACAAC ATCGACGCGT AAGCGCTTTA CCGGCGCAGA ATTTATCGTT 
CATTTCCTGG AACAGCAGGG CATTAAGATT GTGACAGGCA TTCCGGGCGG TTCTATCCTG 
CCTGTTTACG ATGCCTTAAG CCAAAGCACG CAAATCCGCC ATATTCTGGC CCGTCATGAA 
CAGGGCGCGG GCTTTATCGC TCAGGGAATG GCGCGCACCG ACGGTAAACC GGCGGTCTGT 
ATGGCCTGTA GCGGACCGGG TGCGACTAAC CTGGTGACCG CCATTGCCGA TGCGCGGCTG 
GACTCCATCC CGCTGATTTG CATCACTGGT CAGGTTCCCG CCTCGATGAT CGGCACCGAC 
GCCTTCCAGG AAGTGGACAC CTACGGCATC TCTATCCCCA TCACCAAACA CAACTATCTG 
GTCAGACATA TCGAAGAACT CCCGCAGGTC ATGAGCGATG CCTTCCGCAT TGCGCAATCA 
GGCCGCCCAG GCCCGGTGTG GATAGACATT CCTAAGGATG TGCAAACGGC AGTTTTTGAG 
ATTGAAACAC AGCCCGCTAT GGCAGAAAAA GCCGCCGCCC CCGCCTTTAG CGAAGAAAGC 
ATTCGTGACG CAGCGGCGAT GATTAACGCT GCCAAACGCC CGGTGCTTTA TCTGGGCGGC 
GGTGTGATCA ATGCGCCCGC ACGGGTGCGT GAACTGGCGG AGAAAGCGCA ACTGCCTACC 
ACCATGACTT TAATGGCGCT GGGCATGTTG CCAAAAGCGC ATCCGTTGTC GCTGGGTATG 
CTGGGGATGC ACGGCGTGCG CAGCACCAAC TATATTTTGC AGGAGGCGGA TTTGTTGATA 
GTGCTCGGTG CGCGTTTTGA TGACCGGGCG ATTGGCAAAA CCGAGCAGTT CTGTCCGAAT 
GCCAAAATCA TTCATGTCGA TATCGACCGT GCAGAGCTGG GTAAAATCAA GCAGCCGCAC 
GTGGCGATTC AGGCGGATGT TGATGACGTG CTGGCGCAGT TGATCCCGCT GGTGGAAGCG 
CAACCGCGTG CAGAGTGGCA CCAGTTGGTA GCGGATTTGC AGCGTGAGTT TCCGTGTCCA 
ATCCCGAAAG CGTGCGATCC GTTAAGCCAT TACGGCCTGA TCAACGCCGT TGCCGCCTGT 
GTCGATGACA ATGCAATTAT CACCACCGAC GTTGGTCAGC ATCAGATGTG GACCGCGCAA 
GCTTATCCGC TCAATCGCCC ACGCCAGTGG CTGACCTCCG GTGGGCTGGG CACGATGGGT 
TTTGGCCTGC CTGCGGCGAT TGGCGCTGCG CTGGCGAACC CGGATCGCAA AGTGTTGTGT 
TTCTCCGGCG ACGGCAGCCT GATGATGAAT ATTCAGGAGA TGGCGACCGC CAGTGAAAAT 
CAGCTGGATG TCAAAATCAT TCTGATGAAC AACGAAGCGC TGGGGCTGGT GCATCAGCAA 
CAGAGTCTGT TCTACGAGCA AGGCGTTTTT GCCGCCACCT ATCCGGGCAA AATCAACTTT 
ATGCAGATTG CCGCCGGATT CGGCCTCGAA ACCTGTGATT TGAATAACGA AGCCGATCCG 
CAGGCTTCAT TGCAGGAAAT CATCAATCGC CCTGGCCCGG CGCTGATCCA TGTGCGCATT 
GATGCCGAAG AAAAAGTTTA CCCGATGGTG CCGCCAGGTG CGGCGAATAC TGAAATGGTG 
GGGGAATAA

Protein sequence

MASSGTTSTR KRFTGAEFIV HFLEQQGIKI VTGIPGGSIL PVYDALSQST QIRHILARHE 
QGAGFIAQGM ARTDGKPAVC MACSGPGATN LVTAIADARL DSIPLICITG QVPASMIGTD 
AFQEVDTYGI SIPITKHNYL VRHIEELPQV MSDAFRIAQS GRPGPVWIDI PKDVQTAVFE 
IETQPAMAEK AAAPAFSEES IRDAAAMINA AKRPVLYLGG GVINAPARVR ELAEKAQLPT 
TMTLMALGML PKAHPLSLGM LGMHGVRSTN YILQEADLLI VLGARFDDRA IGKTEQFCPN 
AKIIHVDIDR AELGKIKQPH VAIQADVDDV LAQLIPLVEA QPRAEWHQLV ADLQREFPCP 
IPKACDPLSH YGLINAVAAC VDDNAIITTD VGQHQMWTAQ AYPLNRPRQW LTSGGLGTMG 
FGLPAAIGAA LANPDRKVLC FSGDGSLMMN IQEMATASEN QLDVKIILMN NEALGLVHQQ 
QSLFYEQGVF AATYPGKINF MQIAAGFGLE TCDLNNEADP QASLQEIINR PGPALIHVRI 
DAEEKVYPMV PPGAANTEMV GE