Gene Moth_1252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1252
Symbol
ID	3833047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1293701
End bp	1294669
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	58%
IMG OID	637829188
Product	trans-hexaprenyltranstransferase
Protein accession	YP_430109
Protein GI	83590100
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0142] Geranylgeranyl pyrophosphate synthase
TIGRFAM ID	[TIGR02748] heptaprenyl diphosphate synthase component II

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.192713
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGAGT TAGCCCTCTG GCAGGAGGTA CAAGCCGATT TACAACAGGT AGAGGCCGAA 
CTCTTACGGC AGGTGGACGC CCCGGACCCG GTTCTTAGCC AGGCCGCCCG CCACCTGGTC 
CAGGCGGGGG GAAAAAGACT CCGCCCGGCT TTCGCCATCC TGGCGGCCAG GTGTTGCGGC 
GCCCCCCTGG AACGCATCCT ACCCCTGGCG GTGGCCCTGG AAATGATCCA TATGGCCACC 
CTGGTCCATG ATGACGTTAT TGACGCTTCC CCCATCCGGC GGGGACGACC GACGGTCTGG 
GCCCGGTGGG GCCAGGAGCT ATCCCTGCAT ACCGGTGATT ATCTCTTTGC CCGTTCCCTG 
ATTTTGGTAG CTACCTATGA CGACCCGCGA ATACCCTCGG TCCTGGCCAG TGTCAGTGTG 
AAGATGGTAC AAGGGGAAAT CCAGCAAATG GCAGCGGCCT TCGACCTGGA TATTACCCTA 
CGGGATTACC TGGATCGCAT TTACCGCAAA ACCGCCTTGT TGATAGCCGC TAGTTGTGAG 
CTGGGAGCTA TTGCCGCCGG GGCGGACACA GCGACTATAC GCCACCTGCG CTATTATGGT 
CGCAACCTGG GTCTGGCTTT CCAGATTACC GATGACGTAC TGGATATGGT AGCCGACCCG 
GAACAGCTGG GTAAGCCCAT TGGCGGTGAC CTGCGTCAGG GGGTTATTAC CCTGCCGGCC 
ATTTATGCCC TGCAGGCCAG CCCCAAAAAA CAAAAACTCA TCCATCTCCT GGGGAAGAGG 
GATAAAACCC AGGCGGAGAT CCAGGAAGCA ATCCAGCTTA TCAAGGATTG TGGCGGTATC 
AAGTATGCCC TGGATATAGC TGAGGGGTAT TTGGAAAGGG CCAGAAAGCA GGCATCCTAC 
CTGCCTCCGG GTGTGGCCAG GGATACCCTC ACAAGCCTGA CGTATTATAT AAGGACGCGT 
GGTTTTTAA

Protein sequence

MKELALWQEV QADLQQVEAE LLRQVDAPDP VLSQAARHLV QAGGKRLRPA FAILAARCCG 
APLERILPLA VALEMIHMAT LVHDDVIDAS PIRRGRPTVW ARWGQELSLH TGDYLFARSL 
ILVATYDDPR IPSVLASVSV KMVQGEIQQM AAAFDLDITL RDYLDRIYRK TALLIAASCE 
LGAIAAGADT ATIRHLRYYG RNLGLAFQIT DDVLDMVADP EQLGKPIGGD LRQGVITLPA 
IYALQASPKK QKLIHLLGKR DKTQAEIQEA IQLIKDCGGI KYALDIAEGY LERARKQASY 
LPPGVARDTL TSLTYYIRTR GF