Gene Moth_0789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0789
Symbol
ID	3831026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	821839
End bp	822963
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	63%
IMG OID	637828720
Product	flagellar biosynthetic protein FlhB
Protein accession	YP_429650
Protein GI	83589641
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1377] Flagellar biosynthesis pathway, component FlhB
TIGRFAM ID	[TIGR00328] flagellar biosynthetic protein FlhB [TIGR00789] flhB C-terminus-related protein

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0000340873
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCAC ATAACCTGTT GGCATTTTAC GGCGACCAGG ACGTGACGGG TAGACACTTA 
ATCAACCTGC AGCTTTTTGC CGAGGAAAAA ACCGAGGAGG CGACCCCCCA CCGCCTCCAG 
GAAGTGCGCC AGAAGGGCCA GGTGGCCCGG AGCAATGACC TGAGTACGGC CATGGTGCTG 
CTGGCGTGTG TGGTATTCCT TTACTGGCGG CGGGAAACCT TTTACCAGGC CATGGCGGAC 
CTGATTACCA GTACCCTCCA GGATGGCTGG CATCAGCAGC TGGATGGCGG TTCGCTGATG 
GCCCTCGGCA GCCAGCTGGC CTTAAAGGTA GGGCTGCTCC TGGCCCCCCT TCTGGCCCTG 
GCAGCGGCCG TCGGCCTGGC GGCCAATTTC GCCCAGACGG GCTTTGTCTT CTCCCTGGAA 
CCGTTACTCC CGCGCCTGGA GAACCTGGAC CCGGTGAAGG GCATGCAGCG CTTCTTTTCC 
CGGCGGGCCT TGATGGAACT CCTCAAAAGC CTGGCCAAGG TGGTTGTCGT CAGCCTGGTG 
GTCTGGCAGC TGGTTAAGGG GCAGTTTACC CAGCTTCTGC TGACCGTTGA TATGGGGTTG 
CCGGCCACCC TGGACCTGGT GAGCCGGATG GTCTACCGGG TGGGTCTGGG TACAGTGGCC 
GTATTTCTGG CCCTGGCGGC GGCCGATTAT GTCTTCCAGC GGCGGGAGTA CCAGAAAAAC 
CTGCGTATGA CCAGGCAGGA AGTAAAAGAA GAAATGAAGC AGATGGAAGG CGACCCCCTG 
GTGCGTTCCC GGTTGCGGGA GAAGCAGCGC CAGCTGGCCC GGCACCGGAT GATGCACGCC 
GTGCCGGAAG CCACGGTGGT CATCACCAAC CCCACCCATG TGGCTGTAGC CCTGCGTTAC 
CGGGAAGAGG AGAGGGCGCC GCGAGTGGTG GCCAAGGGTG CCGGGAGCAT CGCCGAAAGG 
ATCAAGGCTG TGGCCCGTCG CCACAACGTA CCGGTAGTGG AAAACCCGCC GGTGGCCCGT 
GCCCTCTACC GCCAGGTGGA GCTGGGCCAG GAAATCCCGG TGGCCCTCTA CCAGGCGGTA 
GCCGAGATCC TGGCCCGGAT CTACAAGCTG CGGGGGAGAT TGTAA

Protein sequence

MRAHNLLAFY GDQDVTGRHL INLQLFAEEK TEEATPHRLQ EVRQKGQVAR SNDLSTAMVL 
LACVVFLYWR RETFYQAMAD LITSTLQDGW HQQLDGGSLM ALGSQLALKV GLLLAPLLAL 
AAAVGLAANF AQTGFVFSLE PLLPRLENLD PVKGMQRFFS RRALMELLKS LAKVVVVSLV 
VWQLVKGQFT QLLLTVDMGL PATLDLVSRM VYRVGLGTVA VFLALAAADY VFQRREYQKN 
LRMTRQEVKE EMKQMEGDPL VRSRLREKQR QLARHRMMHA VPEATVVITN PTHVAVALRY 
REEERAPRVV AKGAGSIAER IKAVARRHNV PVVENPPVAR ALYRQVELGQ EIPVALYQAV 
AEILARIYKL RGRL