Gene Moth_2252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2252
Symbol
ID	3830747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2356159
End bp	2357232
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	63%
IMG OID	637830172
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_431082
Protein GI	83591073
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATAAAA TCGCCGTTCT GCCCGGGGAT GGTATCGGCC CGGAGATCGT CCCCGAGGCC 
GTCAAGGTCC TGGAGGCAGT CAGCCGCCGG GTGGGTATTG AATTCCAGTT TACCGAAGCG 
CTGGTAGGCG GCGCTGCCAT CGATGCCCGG GGGATAGCCC TGCCGCCGGA GACCCTGGAG 
CTCTGCCGCC AGAGCGATGC CGTGCTCCTG GGGGCGGTAG GCGGTCCGAA ATGGGATACC 
CTGCCCCCGG CAGAGCGCCC GGAGACGGCA GCCCTGCTGC CCCTGCGTAA AGAACTGGGC 
CTCTATGCCA ACCTGCGCCC GGCTTTTCTC TATGATTCCC TGGTGGAGGC CTCGCCCCTG 
AAGAAGGAAA TAGTCACCGG CACCGACCTG ATTATCGTCC GGGAACTGAC GGGGGGGCTT 
TACTTCGGCG CCAAGAAACG AGAGCAGACC GCCGAGGGGG AAATGGCCTA TGATACCATG 
TATTACACAA GGGCGGAGAT TGAACGCATC GTCCGGCTGG CCTTTACCAT AGCCCGCCAG 
CGGCGCTGCC ACCTGACCAG CGTCGACAAG GCCAACGTCC TCACCACCTC GCGCCTGTGG 
CGGGATACGG TGGAGGATAT CAAAGGCGAG TTCCCCGAGG TAACGGTGGA GCACATGTAT 
GTCGACAACT GCGCCATGCA GCTGGTGCGC CGCCCGGCCC AGTTTGACGT AATTGTGACC 
GAGAATACCT TTGGCGATAT CCTGAGTGAT CAGGCTTCCG TCCTGACGGG TTCCATTGGC 
ATGTTGCCCT CGGCCAGCAT CGGCGGTGCC GTGGCCCTCT ATGAACCCTG CCACGGCTCG 
GCACCGGACA TTGCCGGCCA GCAGAAAGCC AATCCCCTGG CGACCATCCT TTCGGCAGCC 
ATGATGCTGA AGTACTCCTT TAAAATGGAC CAGGCGGCGG CAGCCATTGA GGCGGCAGTA 
GGCAGGGTCC TGGCCAAGGG CTACCGGACC CCGGACCTCT ATGTCCCGGG GACCCAACTG 
GTTGGTACCG CCGAAATGGG GCAACTCGTC CGGCGGGAGC TGGAAGAGGG ATAA

Protein sequence

MYKIAVLPGD GIGPEIVPEA VKVLEAVSRR VGIEFQFTEA LVGGAAIDAR GIALPPETLE 
LCRQSDAVLL GAVGGPKWDT LPPAERPETA ALLPLRKELG LYANLRPAFL YDSLVEASPL 
KKEIVTGTDL IIVRELTGGL YFGAKKREQT AEGEMAYDTM YYTRAEIERI VRLAFTIARQ 
RRCHLTSVDK ANVLTTSRLW RDTVEDIKGE FPEVTVEHMY VDNCAMQLVR RPAQFDVIVT 
ENTFGDILSD QASVLTGSIG MLPSASIGGA VALYEPCHGS APDIAGQQKA NPLATILSAA 
MMLKYSFKMD QAAAAIEAAV GRVLAKGYRT PDLYVPGTQL VGTAEMGQLV RRELEEG