Gene EcSMS35_1771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1771
Symbol	idhA
ID	6145272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1786687
End bp	1787676
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	50%
IMG OID	641616647
Product	D-lactate dehydrogenase
Protein accession	YP_001743825
Protein GI	170680565
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1052] Lactate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.914114
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTCG CCGTTTATAG CACAAAACAG TACGACAAGA AGTACCTGCA ACAGGTGAAC 
GAGTCCTTTG GCTTTGAGCT GGAATTTTTT GACTTTCTGC TGACGGAAAA AACCGCTAAA 
ACTGCCAATG GCTGCGAAGC GGTATGTATT TTCGTAAACG ATGACGGCAG CCGCCCGGTG 
CTGGAAGAGC TGAAAAAGCA CGGCGTTAAA TATATCGCCC TGCGCTGTGC CGGTTTCAAT 
AACGTCGACC TTGACGCGGC AAAAGAACTG GGGCTGAAAG TAGTCCGTGT TCCAGCCTAT 
GATCCAGAAG CCGTTGCTGA ACATGCCATC GGTATGATGA TGACGCTGAA CCGCCGTATT 
CACCGCGCGT ATCAGCGTAC CCGTGACGCC AACTTCTCTC TGGAAGGTCT GACCGGCTTT 
ACTATGTATG GCAAAACGGC AGGCGTTATC GGTACTGGTA AAATCGGTGT GGCGATGCTG 
CGCATTCTGA AAGGTTTTGG TATGCGTCTG CTGGCGTTCG ATCCGTATCC AAGTGCGGCG 
GCGCTGGAAC TCGGTGTGGA GTATGTCGAT CTGCCAACCC TGTTCTCTGA ATCAGACGTT 
ATCTCTCTGC ACTGCCCGCT GACACCGGAA AACTATCATC TGTTGAACGA AGCCGCCTTC 
GATCAGATGA AAAATGGCGT GATGATCGTC AATACCAGTC GCGGTGCATT GATTGATTCT 
CAGGCAGCAA TTGAAGCGCT GAAAAATCAG AAAATTGGTT CGTTGGGTAT GGACGTGTAT 
GAGAACGAAC GCGATCTGTT CTTTGAAGAC AAATCCAACG ACGTGATCCA GGATGACGTA 
TTCCGTCGTC TGTCTGCCTG CCACAACGTG CTGTTTACCG GGCACCAGGC ATTCCTGACA 
GCAGAAGCAC TGACCAGTAT TTCTCAGACT ACGCTGCAAA ACTTAAGCAA TCTGGAAAAA 
GGCGAAACCT GCCCGAACGA ACTGGTTTAA

Protein sequence

MKLAVYSTKQ YDKKYLQQVN ESFGFELEFF DFLLTEKTAK TANGCEAVCI FVNDDGSRPV 
LEELKKHGVK YIALRCAGFN NVDLDAAKEL GLKVVRVPAY DPEAVAEHAI GMMMTLNRRI 
HRAYQRTRDA NFSLEGLTGF TMYGKTAGVI GTGKIGVAML RILKGFGMRL LAFDPYPSAA 
ALELGVEYVD LPTLFSESDV ISLHCPLTPE NYHLLNEAAF DQMKNGVMIV NTSRGALIDS 
QAAIEALKNQ KIGSLGMDVY ENERDLFFED KSNDVIQDDV FRRLSACHNV LFTGHQAFLT 
AEALTSISQT TLQNLSNLEK GETCPNELV