Gene Moth_2519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2519
Symbol
ID	3832574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2625427
End bp	2626815
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	55%
IMG OID	637830442
Product	tRNA modification GTPase TrmE
Protein accession	YP_431344
Protein GI	83591335
COG category	[R] General function prediction only
COG ID	[COG0486] Predicted GTPase
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00450] tRNA modification GTPase TrmE

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00190608
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCTTGACG ATACCATTGC CGCCCTGGCG ACACCGCCTG GTGAAGGCGG TATTAGCATA 
ATTCGCCTGA GCGGCAGCCA GGCCATTGCT ATAGTAGCAA AGGTTTTTAA ACCGGTCAAG 
GGACCTGATT TAACCACAAC CAGGAGTCAT ACCCTGCGGT TGGGATTCAT AATTGATCCT 
GTTTCTGGGG AAAGTCTGGA CGAGGTTCTG GTTAGTGTCA TGCGGGCTCC TCATAGTTAT 
ACGGCTGAGG ATGTGGTGGA GATAAACTGC CACGGGGGCG CCCTGGCCAC GTCCAGGGTG 
CTGCAACTGG TCCTGAGAAC CGGTGCCAGG TTGGCCGAGC CGGGAGAGTT CACTCGCCGG 
GCTTTCCTCA ACGGCCGCCT GGACCTGGCC CAGGCCGAAG CGGTCCTGGA GATTATCCGC 
GCCAGGAGCA GCAGGGGTTT GACGGCAGCC CTGGATCACC TACGGGGTAA CCTCTCCCGG 
AAGATTGGCG AACTGAATGA ACGCTTGACC GGCATCCTGG CGGCCCTGGA AGCCAGTATG 
GATTTTCCTG AGGAGGTCGG CGAGGTAGAC CCGGAGAATC TAGCTGACCT GCGCCGCATC 
CTGGCGGGAG TTGACAGACT CCTGGCTACC TGGGAAGAAG GCCGACTTTT AACTGAAGGC 
TTAAAAGTAG CTATTGTCGG CCGACCCAAT GTCGGCAAAT CAAGCCTGTT AAACGCCCTG 
TTAAACCAGG AACGAGCCAT TGTCAGCAAC ATCCCAGGTA CCACCAGGGA TACCATTGAG 
GAAACCCTGC AACTCGGGGG ATTTACCTGC CGCTTGATAG ATACAGCCGG GCTGCGGGAG 
ACAGCGGATG AATTGGAGAG CATCGGCGTA GCCAGAAGTA AGAAGGCCAT TGCAGCGGCT 
GACCTGGTGC TGGTGGTTGT TGACCTGCAA ACAGGAATCC AGGATGAAGA CCGGCGCGTT 
TTGGAGAGTG TCAGGGATAA GGTTTTGATA ATCATAGGCA ACAAGCTGGA TCTTGTAGCC 
CACGATATAA ATAAAAAATT GGCTGACCTC GAATCCTTTG CCGGAAATTA TCCCCGGGTA 
GCTGTTTCCG CCCTCAAAGG TAAAGGATTA GATGAACTGG CCAGAAAAGT CCAGGAGATT 
GTCCTGGGTG GAAGAGCCCT GGCAGGTAGC GATGAACCCT TAATCACCAA TGCCCGTCAC 
CGGGCTGCCC TGGAAAATTG CCGGGAGCAC CTGGCCAGCG CCATTAAAGC CTGGGAAGAA 
GGATTACCTG AGGATTTAAT CGCCATTGAC CTCTGGTCAG CAGCAGATTA CCTGGGAGAA 
ATCATCGGAA CCACTGCCCG GGAGGATCTT CTGGACCGGA TATTCAGCGA TTTCTGCATC 
GGCAAGTAA

Protein sequence

MLDDTIAALA TPPGEGGISI IRLSGSQAIA IVAKVFKPVK GPDLTTTRSH TLRLGFIIDP 
VSGESLDEVL VSVMRAPHSY TAEDVVEINC HGGALATSRV LQLVLRTGAR LAEPGEFTRR 
AFLNGRLDLA QAEAVLEIIR ARSSRGLTAA LDHLRGNLSR KIGELNERLT GILAALEASM 
DFPEEVGEVD PENLADLRRI LAGVDRLLAT WEEGRLLTEG LKVAIVGRPN VGKSSLLNAL 
LNQERAIVSN IPGTTRDTIE ETLQLGGFTC RLIDTAGLRE TADELESIGV ARSKKAIAAA 
DLVLVVVDLQ TGIQDEDRRV LESVRDKVLI IIGNKLDLVA HDINKKLADL ESFAGNYPRV 
AVSALKGKGL DELARKVQEI VLGGRALAGS DEPLITNARH RAALENCREH LASAIKAWEE 
GLPEDLIAID LWSAADYLGE IIGTTAREDL LDRIFSDFCI GK