Gene Moth_1328 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1328
Symbol
ID	3831038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1373127
End bp	1374167
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	61%
IMG OID	637829264
Product	isopentenyl pyrophosphate isomerase
Protein accession	YP_430184
Protein GI	83590175
COG category	[C] Energy production and conversion
COG ID	[COG1304] L-lactate dehydrogenase (FMN-dependent) and related alpha-hydroxy acid dehydrogenases
TIGRFAM ID	[TIGR02151] isopentenyl-diphosphate delta-isomerase, type 2

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00294191
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.034708
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACGAGA GAGAATATAT AGGTAGGGGC CGGCGCAAGC TGGAGCACCT GCGTTTTTTC 
CAGGAAGATA GTAAGGGCAG CAATGGCCTG GAGGACGTGC ACCTGGTTCA TCAGGCCCTG 
CCCGAACTTA ACTGGTCGGA TATCGATCTT ACCTGCCGGT GGCTGGGGAA AACCCTGGCC 
GCCCCTTTTA TTATTAATGC CCTGACCGGC GGACCTCCGG AGACTCTGGC CATTAACGCC 
GCCCTGGCGC GGGTGGCCAG GCGGACGGGG ATTGCCCTGG CCGTAGGCTC CCAGCGGGCG 
GGCCTTGAGA ATAAAGAATG GCGGGAGAGC TTCACCATTG TCCGCCGGGA GAATGCTAAC 
GGGTTAATCC TGGCCAATAT TGGTGCCGGG AACTCGCCGG CGGACGCCGG GGAGGCCGTG 
GCCATGATTG CCGCTGACGG CCTGCAGGTA CACCTCAATG CCGCCCAGGA ATTGATAATG 
CCGGAGGGTG ATCGTGCTTT CCGGGGCTGG TTGGAGAACA TCAGGGGGAT GGTAAACACC 
CTGGGTGTAC CTGTTATCGC CAAAGAAGTG GGCTTTGGCC TCTCTCGGGA AACAGCCTTG 
CAACTATACC AGGCCGGGGT TCGTATTATG GACGTCGGTG GCCGGGGCGG GACCAACTTT 
GCGGCTATTG AGGAAAGGCG CCGGGGCCGG TCGGTCGCGG CCCTGGCTGG ATGGGGCCTG 
TCAACGGCGG TTAGCATTCT GGAAATAAGG GAACTGGGCC TTCCAGTGGA GGTGGTAGCC 
ACCGGTGGCA TCCGCAGCGC CCTGGACGCC GCCAGGGCCC TGGCCCTGGG GGCAAAAATT 
GTAGGGGCGG CTGGGTACTT CCTGAAAATC CTCCTGGAAC AGGGTGAAGA TGCCCTTACG 
GAAGAGATCC TGCAGTGGCA GGAGGATTTA AAACGCATCT GCTTGCTCAC CGGCTGCACC 
ACCCCGGCTG AACTGGCTAC CAAACCGGTA GTTATTACTG GCCAGACCAG GGCCTGGCTG 
GAGGGTAGGC AACGCCATTA G

Protein sequence

MNEREYIGRG RRKLEHLRFF QEDSKGSNGL EDVHLVHQAL PELNWSDIDL TCRWLGKTLA 
APFIINALTG GPPETLAINA ALARVARRTG IALAVGSQRA GLENKEWRES FTIVRRENAN 
GLILANIGAG NSPADAGEAV AMIAADGLQV HLNAAQELIM PEGDRAFRGW LENIRGMVNT 
LGVPVIAKEV GFGLSRETAL QLYQAGVRIM DVGGRGGTNF AAIEERRRGR SVAALAGWGL 
STAVSILEIR ELGLPVEVVA TGGIRSALDA ARALALGAKI VGAAGYFLKI LLEQGEDALT 
EEILQWQEDL KRICLLTGCT TPAELATKPV VITGQTRAWL EGRQRH