Gene Moth_2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2135
Symbol
ID	3833135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2232314
End bp	2233285
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	62%
IMG OID	637830060
Product	GTP cyclohydrolase subunit MoaA
Protein accession	YP_430970
Protein GI	83590961
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2896] Molybdenum cofactor biosynthesis enzyme
TIGRFAM ID	[TIGR02666] molybdenum cofactor biosynthesis protein A, bacterial

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGGACA CCTTTCAACG CCAGATAAAC TACCTGCGCA TCGCCATTAC CGATCGCTGT 
AACCTGCGCT GCCGTTATTG TATGCCGGCC ACGGGGGTGC CCTTGAAGGG TCACGAGGAT 
ATCCTGCGCC TGGAAGAGAT CGCCACCCTG GCCCGGGTAG CTGCCGGTAC TGGTATCAGC 
CGGATTCGCC TCACCGGGGG CGAGCCCCTG GTCCGGAAAA ACGTGGTGAC CCTGGTGCGG 
GAACTGGCGG CCATTCCCGG CCTGGAGGAG ATCTCCCTGA CAACCAACGG CATCTTCCTG 
GGGGCCCTGG CCTTTTCTTT AAAAGAGGCC GGACTGAAGC GGGTGAATAT CAGCCTGGAC 
ACCCTGAAGA AGGACCGCTA CCGCTATATC ACCCGCCGCG GCAACATCAC CAGCGTCTGG 
CAGGGCATCC GGGCGGCCCT GGCCGCTGGC CTGACGCCGG TTAAACTCAA TGTCGTCATT 
ACGCGGGGCT TTAACGACGA TGAGATCCTG GATTTTGCCC GGCTGGCCAG GGAAGAACCC 
CTGCATATCC GTTTTATCGA GCTCATGCCC ATTGGTACGG CGGCCGCCTC CGGTACCGCT 
TATGTGCCGG CGGAGGAGAT TAAGGGCCGG ATCAGCCGGG TTTACCCCCT GGAACCCTTC 
CCGGACCTGG CAACCAACGG GCCGGCAGCC AATTTCAGGC TGGTCGGCGG CCGGGGAAGT 
GTGGGATTTA TCACCCCCAT GTCCAATCAC TTCTGTTCCC GCTGTAACCG CCTGCGCCTG 
ACGGCAGACG GCAAGCTCAG GCCCTGCCTC TACTGGGACG GGGAGATAGA TATCAAAGGG 
CCTTTGCGTG CCGGGGCTCC GGAGACCGAA CTGGCGGCTA TTTTTGCCCG GGCCGTCAGC 
TTGAAGCCCG CCGAACACCA CATGGAGAAC GGCTGGCGCC AGCCCCGGGC CATGTCCCAG 
ATAGGCGGCT GA

Protein sequence

MQDTFQRQIN YLRIAITDRC NLRCRYCMPA TGVPLKGHED ILRLEEIATL ARVAAGTGIS 
RIRLTGGEPL VRKNVVTLVR ELAAIPGLEE ISLTTNGIFL GALAFSLKEA GLKRVNISLD 
TLKKDRYRYI TRRGNITSVW QGIRAALAAG LTPVKLNVVI TRGFNDDEIL DFARLAREEP 
LHIRFIELMP IGTAAASGTA YVPAEEIKGR ISRVYPLEPF PDLATNGPAA NFRLVGGRGS 
VGFITPMSNH FCSRCNRLRL TADGKLRPCL YWDGEIDIKG PLRAGAPETE LAAIFARAVS 
LKPAEHHMEN GWRQPRAMSQ IGG