Gene Moth_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1894
Symbol
ID	3831167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1958467
End bp	1960245
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	60%
IMG OID	637829827
Product	GTP-binding protein TypA
Protein accession	YP_430737
Protein GI	83590728
COG category	[T] Signal transduction mechanisms
COG ID	[COG1217] Predicted membrane GTPase involved in stress response
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR01394] GTP-binding protein TypA/BipA

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00474713
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCAGC AAAAGATACG CAACCTGGCG ATAATCGCCC ACGTCGATCA TGGCAAGACG 
ACCCTGGTCG ACGGCATGCT GAAACAGAGC GGCATTTTCC ACGAGAAGCA GGTGGTCCAG 
GAGCGTATCC TGGACCGCAA CGATCTGGAA CGGGAACGCG GCATCACTAT CATGGCCAAG 
AATACCGCTG TCTTTTACCG GGGTTACAAG CTGAACATCG TCGACACCCC CGGCCACGCC 
GATTTCGGCG GCGAAGTGGA GCGCATCGTC CAGATGGTGG ACGGGGCCCT CCTACTGGTG 
GACGCCTTCG AGGGCCCCAT GCCCCAGACT CGTTTTGTCC TGAAAAAGGC CCTGGCGGTG 
GGTCTGAAAC CCATTGTGGT CATCAATAAA ATGGACCGGC CCAACGCCCG GCCGGGGGCG 
GTGGTCGACG AAGTCCTGGA CCTTTTCATC GACCTGGGAG CCACCGAGGA GCAGCTGGAT 
TTCCCGGTGG TCTACACAGT AGCCCGCCAG GGAACGGCCA GCCTGGACCC GGACCAGCCC 
GGGAAAGACC TGCAGCCTCT GTTTGACATA ATCGTCCAGC ATATACCAGC CCCCGGCGGG 
GACCCGGAGG CAACCCTGCA GGTAGGAGTC AACCTCATTG ATTATGACAC TTATGTCGGC 
CGCCAGGCCA TCGGCCGGGT ATATAACGGC ACCATCCGCG CCCGGCAGGA AGTGGCCGTT 
GCCCGGCCCG ACGGCAGCCT GGTCCGGGGG CATGTGGCTG CCCTGCATGT TTTTGAAGGT 
CTCAACAAGG TGCCGGTGGA TGAAGCCGCC GCCGGGGAGA TCGTCGTCGT CAGCGGCCTG 
GAGGACATCA ACGTCGCCAA TACCATTACC TCGCCGGAGG ACCCCCGGCC CCTGGACTTT 
GTCCGTATCG ACGAGCCCAC GGTGGCTATG ACTTTCATGG TCAATAAGAG CCCCTTCGCC 
GGCCGGGAAG GGGAGTATGT AACTTCCCGG AAGCTCCGGG AGCGCCTCCT CAGGGAGGCG 
GAATCGGATG TCAGCCTGCG GGTGGAGGAA ACGGATTCCC CTGACGCCCT GCTGGTTTCC 
GGCCGGGGCG AGCTGCACCT CGCCATCCTC ATCGAAACCA TGCGCCGGGA GGGGTATGAA 
TTCGAAGTCT CCCGGCCCCA GGCGATTATT AAAGAAATAA AGGGCGTCAA GTGCGAGCCC 
GTTGAAGAAC TCATTATAGA GGTTCCGGAA ACCTATATGG GCATCGTCAT CGAGCGCCTG 
GGTCCCCGCA AAAGCGAGAT GGTCAACCTG GAAAACAAGG GGGACGGCCA GGTGCGCCTG 
ACCTTTCATA TCCCCACCCG GGGGCTCTTC GGCTTCCGTT CCGAATTCCT TACCGATACT 
AAAGGTCTGG GCATCATGCA CCACGCCTTT CACCATTACG CCCCCTATGC CGGGGAGATT 
GCTACCCGGA CGCGTGGTTC TCTGGTGGCC TTTGAAACCG GGGAAACAAC CAGCTATGGC 
CTGGAGAACG CCCAGGAGCG GGGCGAGCTC TTTGTCGGCC CTGGGGTACC AGTCTACCGG 
GGGATGATTG TCGGCGAGCA TTCCCGGCCC GGCGACCTGA TGATCAACGT CTGCAAAAAA 
AAGCAACTGA CCAACGTCCG CAGTTCTACC GCCGATATTG CTATCAAACT GGTCCCGCCC 
CGGGAGATGA CCCTGGAGCA GTGCCTGGAA TTTATCGCTG CCGACGAACT CCTGGAAGTG 
ACGCCCAGGT CCCTCAGGAT GCGAAAGAGG GATATATAA

Protein sequence

MDQQKIRNLA IIAHVDHGKT TLVDGMLKQS GIFHEKQVVQ ERILDRNDLE RERGITIMAK 
NTAVFYRGYK LNIVDTPGHA DFGGEVERIV QMVDGALLLV DAFEGPMPQT RFVLKKALAV 
GLKPIVVINK MDRPNARPGA VVDEVLDLFI DLGATEEQLD FPVVYTVARQ GTASLDPDQP 
GKDLQPLFDI IVQHIPAPGG DPEATLQVGV NLIDYDTYVG RQAIGRVYNG TIRARQEVAV 
ARPDGSLVRG HVAALHVFEG LNKVPVDEAA AGEIVVVSGL EDINVANTIT SPEDPRPLDF 
VRIDEPTVAM TFMVNKSPFA GREGEYVTSR KLRERLLREA ESDVSLRVEE TDSPDALLVS 
GRGELHLAIL IETMRREGYE FEVSRPQAII KEIKGVKCEP VEELIIEVPE TYMGIVIERL 
GPRKSEMVNL ENKGDGQVRL TFHIPTRGLF GFRSEFLTDT KGLGIMHHAF HHYAPYAGEI 
ATRTRGSLVA FETGETTSYG LENAQERGEL FVGPGVPVYR GMIVGEHSRP GDLMINVCKK 
KQLTNVRSST ADIAIKLVPP REMTLEQCLE FIAADELLEV TPRSLRMRKR DI