Gene Moth_0993 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0993
Symbol
ID	3830869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1020920
End bp	1021930
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	59%
IMG OID	637828922
Product	isocitrate dehydrogenase (NADP)
Protein accession	YP_429851
Protein GI	83589842
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00175] isocitrate dehydrogenase, NAD-dependent, mitochondrial type [TIGR00183] isocitrate dehydrogenase, NADP-dependent, prokaryotic type [TIGR02088] isopropylmalate/isohomocitrate dehydrogenases

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000014677
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0984652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTTGAAAC ATGTAGTTAC TCTGATTCCC GGGGATGGTA CCGGCCCGGA GTTAATCGCC 
GCCGCCAGGC GGGTCCTGGA AGCCAGCGGT GCGGAACTGG AATGGGAGGT TATGGCAGCC 
GGGGAGGGCG CCCAGGAGAA ATACGGCAGC GTGTTGCCAG AAGAGACCCT GGCTTCAATC 
CGTAAAAATG GCGTCGCCCT TAAAGGCCCT ATCACCACCC CGGTGGGCAC CGGCTTCCGG 
AGCGTCAATG TGGCCCTGCG GAAAGAGCTG GATCTCTATG CCAATGTCCG GCCCTTCCGC 
AACTTGCCCA ATGTCCCCTC ACGCTATCAG GGTGTTGACC TGGTGATCTA CCGGGAGAAC 
ACCGAGGACC TCTATGCCGG GGTTGAACAT ATGGTGGGTG AAGATGCGGC TGAAAGCATT 
AAGATTATTA CCAGGAAGGG CTCCGAACGT ATCGCCCGGG CAGCCTTTGA ATACGCCCGG 
CGCCAGGGCC GGAAACGGGT GACAGCCGGC CACAAGGCCA ATATTATGAA GTTCAGCGAC 
GGTCTTTTCC TGCGGACCTT CTACGACGTA GCCAGGGATT ATCCGGAAAT AACGGCTGAT 
GACCGTATTG TGGACAACCT GAGCATGCAG CTGGTCCAGA AGCCGGAGCA ATATGATGTC 
CTGGTACTGC CCAACCTTTA CGGCGATATC CTCTCCGACC TCTGCGCCGG CCTGGTGGGC 
GGCCTGGGAG TGGCCCCTGG AGCCAATATC GGGGAGAAGG CAGCCGTCTT TGAACCAATC 
CACGGCAGCG CACCCAAGTA TGCCGGCCAG AATAAGGTAA ATCCCCTGGC CACTATCCTC 
TCCGGGGTTA TGATGCTGGA ACACCTGGGC GAGAAGGAAG CAGCAGCCAG GATCCAGCGC 
GCTATCCTGG CGGTCCTGGC AGAAGGCAAG TACTTGACCT ACGATCTGGG CGGCAGTGCC 
GGTACGAGCG ATATGGCCGA CGCCATCGTC AGGCGACTGG AAGTAGAATA A

Protein sequence

MLKHVVTLIP GDGTGPELIA AARRVLEASG AELEWEVMAA GEGAQEKYGS VLPEETLASI 
RKNGVALKGP ITTPVGTGFR SVNVALRKEL DLYANVRPFR NLPNVPSRYQ GVDLVIYREN 
TEDLYAGVEH MVGEDAAESI KIITRKGSER IARAAFEYAR RQGRKRVTAG HKANIMKFSD 
GLFLRTFYDV ARDYPEITAD DRIVDNLSMQ LVQKPEQYDV LVLPNLYGDI LSDLCAGLVG 
GLGVAPGANI GEKAAVFEPI HGSAPKYAGQ NKVNPLATIL SGVMMLEHLG EKEAAARIQR 
AILAVLAEGK YLTYDLGGSA GTSDMADAIV RRLEVE