Gene Moth_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0804
Symbol
ID	3832135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	835017
End bp	835988
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	55%
IMG OID	637828735
Product	flagellar motor switch protein FliM
Protein accession	YP_429665
Protein GI	83589656
COG category	[N] Cell motility
COG ID	[COG1868] Flagellar motor switch protein
TIGRFAM ID	[TIGR01397] flagellar motor switch protein FliM

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.629305
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGACG TCCTATCCCA GGCGGAGATT GACGCCCTCC TCCAGGCCCT GAACAGCGGC 
GAGGTTCAGA CGGAGGTCAT TAAAGAAGAG GCTACCCCTA AGGCCAAGAA ATACGACTTT 
CGCCGGCCCA ATAAGTTTTC CAAGGAACAC CTGCGCACCC TGTATATGAT CCACGAAAAT 
TACGGGCGCC TGGTGGCCAA CTTCCTTTCG GCCTACCTGC GGGCCAGCAT CCAGGTGAAG 
ATCGTCTCGG TGGAACAGAT GACCTATGAG GATTTTATTC TCTCGTTGCC GACGCCGACC 
CTGATGAACG TCTTCAGCAT GGAGCCTTTA AAGGGTTCGG CGGTCCTGGA GACCAACATG 
AATTTCATCT TCCCCATTAT CGACCTGCTC TTCGGCGGTC GGGGGGAGAT GGTGGCCCGT 
AACCGGGAGT TGACGGAGAT CGAGCTCCAC GTCCTGCGGC GTTTAAACAG CCGCATGCTG 
GAACAGCTCT CCTATTCCTG GTCCGACATC CAAAACATTA CTCCCAAATT GGAGAATATG 
GAAACCAACC CCCAGTTTAC CCAGGCCATT TCCCCCAACG AGACGGTTGC CGTCATCACC 
ATGGGGACAA CGGTGGGCAA GTATGAGGGT CTTTTAAACC TCTGCCTGCC CTATATGCTC 
CTGGAGCCGG TCATTTCCCG CCTTTCGGCC AGCCACTGGT TTGCCACCGG CGGGGAAAGG 
GAAGCCAGGC CTGATTACCG GACGGTGGTC GAGAAGATCC TGGCCGAAGT GCCGGTGGAA 
TTGATCGCTT ACATAGGCCG CACCCGCTTG CCGGTGCGGG ATTTTATCCA GCTCCAGGTT 
GGGGATGTCA TTACCCTGGA AAAAACAGTG GGCGAGGACC TGGAACTCTA TGTAGACGGG 
CACCATAAGT TTCAGGTTCA ACCGGGGATT GTGAATAAAA AAATTGCCGT CCAGGTAACA 
GAGGTGGTAT AG

Protein sequence

MADVLSQAEI DALLQALNSG EVQTEVIKEE ATPKAKKYDF RRPNKFSKEH LRTLYMIHEN 
YGRLVANFLS AYLRASIQVK IVSVEQMTYE DFILSLPTPT LMNVFSMEPL KGSAVLETNM 
NFIFPIIDLL FGGRGEMVAR NRELTEIELH VLRRLNSRML EQLSYSWSDI QNITPKLENM 
ETNPQFTQAI SPNETVAVIT MGTTVGKYEG LLNLCLPYML LEPVISRLSA SHWFATGGER 
EARPDYRTVV EKILAEVPVE LIAYIGRTRL PVRDFIQLQV GDVITLEKTV GEDLELYVDG 
HHKFQVQPGI VNKKIAVQVT EVV