Gene Moth_0537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0537
Symbol
ID	3830922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	559915
End bp	560955
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	58%
IMG OID	637828478
Product	rod shape-determining protein MreB
Protein accession	YP_429410
Protein GI	83589401
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG1077] Actin-like ATPase involved in cell morphogenesis
TIGRFAM ID	[TIGR00904] cell shape determining protein, MreB/Mrl family

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.433633
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTTCG CCCGAGACCT CGGGATTGAC CTTGGTACGG CCAATACCCT GGTTCACGTC 
CGCAATAAAG GTATCATCCT GCGAGAACCA TCGGTGGTGG CCATCCAGCG GGGGACCGGC 
AATGTCATGG CCGTTGGCGA AGAAGCCAAG CGAATGATTG GCCGGACGCC GGGGAACATT 
GTTGCTATTC GTCCTTTGAA AGACGGCGTT ATTGCTGATT TTGACGTTAC CCAGAGTATG 
TTGCGTTACT TTATTGAGAA GGCCATACCC AAGGGTTTTC TGGTACGGCC CCGGGTGGTC 
GTGGGGGTCC CCTCGGGTGT GACGGCAGTA GAGGAACGGG CCGTCCGGGA AGCGGCTCTC 
CAGGCCGGGG CTAAGGAAGC CTACCTCATT GAAGAGCCTA TGGCAGCGGC CATCGGTGCC 
GGTTTACCCG TCTATGAGCC TACGGGGAAT ATGATTGTGG ACATCGGCGG TGGTACCACT 
GAGGTCGCCG TTATCTCCCT GGGGGGGATA GTGACCAGCC GTTCCATCCG CATCGGTGGC 
GATGAGATGG ACGAGGCCAT TACCCAGTAT ATTAAGCGCA CTTACAACCT GATGATCGGT 
GAGCGGACGG CTGAAGAGAT AAAGATTGAA CTGGGTGCCG CTTACTTTGG GGATACCGAT 
GAAGATCGGG AACGCCAGCA ACGTACCTAT GCCGTCCGGG GCCGGGACCT GGTAACCGGT 
TTACCCAAGA CCATTGAGAT TACGGCTACA GAGGTCCAGG AGGCCCTATC GGAGCCGGTG 
GCGGCCATTC TGGAGGCTAT TAAAGTCTGC CTGGAGCGGA CTCCCCCCGA GCTGGCAGCT 
GACCTCATGG ACCGGGGTAT TGTCCTGGCC GGTGGCGGGT CCCTACTTTG GGGTCTGGAT 
CGCCTGGTCA GCCAGGAAAC CGGTATGCCT GTCAATATGG CCGAAGATCC GTTGACAGCA 
GTGGCCATAG GTACGGGTAA GGTGCTGGAG AATATCGAGG TTTTGAAACG GGTGCTTTTA 
CCGGCGCGGC GCTCGGGTTA G

Protein sequence

MIFARDLGID LGTANTLVHV RNKGIILREP SVVAIQRGTG NVMAVGEEAK RMIGRTPGNI 
VAIRPLKDGV IADFDVTQSM LRYFIEKAIP KGFLVRPRVV VGVPSGVTAV EERAVREAAL 
QAGAKEAYLI EEPMAAAIGA GLPVYEPTGN MIVDIGGGTT EVAVISLGGI VTSRSIRIGG 
DEMDEAITQY IKRTYNLMIG ERTAEEIKIE LGAAYFGDTD EDRERQQRTY AVRGRDLVTG 
LPKTIEITAT EVQEALSEPV AAILEAIKVC LERTPPELAA DLMDRGIVLA GGGSLLWGLD 
RLVSQETGMP VNMAEDPLTA VAIGTGKVLE NIEVLKRVLL PARRSG