Gene Moth_2371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2371
Symbol
ID	3832551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2496891
End bp	2497928
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	63%
IMG OID	637830290
Product	rod shape-determining protein Mbl
Protein accession	YP_431196
Protein GI	83591187
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG1077] Actin-like ATPase involved in cell morphogenesis
TIGRFAM ID	[TIGR00904] cell shape determining protein, MreB/Mrl family

Plasmid Coverage information

Num covering plasmid clones	56
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000614585
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTTGGCT TCGGTCAGGA TATAGGTATT GATTTAGGGA CGGCCAGCGT CCTGGTCTAC 
CTCCAGGGTA AAGGGATTGT CCTCCGGGAA CCTTCGGTGG TGGCCCTGGA CCGGGACAGC 
GGCCAGATAT TTGCCGTGGG GGAAGAAGCC CGGCGCATGC TGGGGAGGAC GCCGGGAAAT 
ATTATCGCCC TGCGCCCTTT ACGGGACGGG GTTATAGCCG ACTACGACAG CACCGAAAAG 
ATGCTACGCT ACTTTATTGA TAAAGCCTGC GGCCGCCAGG GCTTCCTCCG GCCAAGGGTC 
ATGGTCTGCA TACCCTCCGG GGTCACCGGG GTGGAGGAGC GGGCCGTGCG CCAGGCGGCC 
CTGCAGGCCG GGGCCAAGCA GGCCTTTGTC ATTGAAGAGC CCCTGGCGGC GGCCCTGGGC 
GCCGGCCTGG ATATCGCCGA GCCCAGCGGT TCCATGGTGG TGGACATCGG CGGCGGCACC 
ACCGACATTG CCGTCCTTTC CCTGGGGGGC ATCGTCTGTA GCAATTCTCT GCGGGTCGCC 
GGGGACAAAA TGGATGAAGC CATCGTCCGC TATATCCGGC GCGAGCACAA CCTGATGATC 
GGCGAGCGCA GCGCCGAAGA ATTAAAAATG AAAATCGGCA CGGTCCACCG CTCCGTCGGC 
GAAGGTGAGA GTATGGACAT CCGCGGGCGC GACCTGGTGA CCGGCCTGCC GAAGACGGTG 
AATATCACCT CCCTGGAGAT CTTTACCGCC CTCCAGGAAC CAGTCCAGCA GATTGTCGGG 
GCGGTGAAGG AGGTCCTGGA GCAGACGCCA CCGGAGCTGG CCGCCGATCT GGTCAACAAG 
GGGATCGTCA TGACCGGGGG CGGCAGCCTG ATCCGTGGCA TTGACGTCCT CCTGAGCGAG 
GAGACTGGCC TGCCGGTCTA TATCGCCGAC GACCCCATCT CCTGCGTCGC CCTGGGTACC 
GGCAAAGCCC TGACCATGCT GGGGGTGTTA AAGCAGAGCA ATCCTTCGGA GGGACGGCGC 
CCGGTCCTGA AACGTTAA

Protein sequence

MFGFGQDIGI DLGTASVLVY LQGKGIVLRE PSVVALDRDS GQIFAVGEEA RRMLGRTPGN 
IIALRPLRDG VIADYDSTEK MLRYFIDKAC GRQGFLRPRV MVCIPSGVTG VEERAVRQAA 
LQAGAKQAFV IEEPLAAALG AGLDIAEPSG SMVVDIGGGT TDIAVLSLGG IVCSNSLRVA 
GDKMDEAIVR YIRREHNLMI GERSAEELKM KIGTVHRSVG EGESMDIRGR DLVTGLPKTV 
NITSLEIFTA LQEPVQQIVG AVKEVLEQTP PELAADLVNK GIVMTGGGSL IRGIDVLLSE 
ETGLPVYIAD DPISCVALGT GKALTMLGVL KQSNPSEGRR PVLKR