Gene Moth_0384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0384
Symbol
ID	3832628
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	389553
End bp	391151
Gene Length	1599 bp
Protein Length	532 aa
Translation table	11
GC content	48%
IMG OID	637828321
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_429261
Protein GI	83589252
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATTAT TCCCTTACTT ACTTGTTATA TCCCTTTGTA TTATTGTGGT CACTGTAACG 
CTTGGTTCGG GAACTCTAGT AATGGTGCTT GTTGGAATTC TTTTAAGTAG TACAGGAGCT 
TTCTTGCTAT GGCAGAGATG GATCCACCCG CTTTTGCTTC TTCAGCGGTT CCTCTCCCTT 
TTGGAAAAAG GTGATCCGGT AGCTGCAGAA AAATTTTTAA AGGCCCAGAA ATGGAGCAGG 
GGCTTTCATG AGATAGCCGG TCGGGTCCTA GAAGCTTTTT TTCGCATGAT CGGGAACATG 
CAGAGGAGTT CGGATGAGCT AAATTATCTC GTCGGGGTGA TACAGCGCGA AGCAGAGGCC 
AATCGTGTAA GTCTTGCTGA GATAGCTCGG ACTATGCAAG ATATGGCCGG TGGTGCGGAT 
GAGGAAGCCG GGGCTACCCA AAGAGTAGCG GAAAATGTAG AAGCATTGAC GGCTTTAGCT 
AAGGACATAG CCCATCTTTC CTCAGAAGGA GTCAATCTGG TAGGTGAGGC TAAACGACGT 
GAGGAGAAGG GCAGAGAGGT TCTAAAGGTT CTGCTGGCCA ATATGGAACG GGCGGCGGTG 
TCGATAGAAG AGGCAGCGGA GAAGGTTATG AGGCTGGAGG TGAAAATAGA GAAAGTCAAC 
GAGTTTGTAA GATATGTAAC GGAGATAACG GACCAGACGA ATCTACTGGC GTTGAACGCG 
GCGATCGAGG CGGCGCGGGC AGGTGATTCT GGCCGCGGTT TTGCAGTGGT AGCTGGAGAA 
GTAAGGAAAC TAGCCGAACG TTCCGCGCAG GCTGCGCAGA ATATAGTACG TATAGCGGAG 
ACGATCCAGG AGGTGGCAAA GGAGGCGGCA AAACAGGTAG AGGAGAATGT AAGGCTAGTA 
AAAGATAACT TGGAGCAGGG CGAAGAGACA ATGCGGGAAA TGGAGGAAGT TACAGAGGCC 
TTTACTCGTG TTGCTGGTGC CATGGAAGAG ATATACAGCA ACGCCCGTAA ACAGGCAGAG 
CGGGCGCAGA ATATAAACCA GGATGCATCC CATATGGCGG CCGTAGCCCA GGAGACGGCA 
GCGGGAGTAG AAGAGGTAAC AGCTTCAGTG GCGCATCAGG AGATGGCCAT GGAAACAATG 
GAGGAAAGCG TTGTCAAGCT ATCGGACATG GCTGGACGCT TTGATGAACT TGCAAACCAG 
TACACGAAAG AAGGATGGGA CGAGGCTACG AAAAACAGCC TGATCCAGAA CGGGATGCAG 
ATTTTAAAGA GTTTGGCAGA AAATAGCGAG ATAAAAAGTA TGCAAATAGA AAAATTAAGA 
AAGCCTTTCG ATGAAGCAGT TGCAGGTCTA GATTTCATCA AATACCCCAT GGTAGTAGGC 
CTTGACGGTA ACATTATCTA CTCTCCTTTG AAATTTAATC AATCTATCAA CTGGTCATTT 
AGACCGTGGT TTCAGGCCGC GATAAAGGGG GAGTCTTACA TAGGGAAACC TTATATAACT 
CAGGCGACTA ACAGGTTGGC TGTACCCATT TCATGCCCCA TTAAAAATGA AAAAGGGGAA 
GTTTTAGGGG TGTTAGCAGC AAATATTGCC GAAGATTAG

Protein sequence

MPLFPYLLVI SLCIIVVTVT LGSGTLVMVL VGILLSSTGA FLLWQRWIHP LLLLQRFLSL 
LEKGDPVAAE KFLKAQKWSR GFHEIAGRVL EAFFRMIGNM QRSSDELNYL VGVIQREAEA 
NRVSLAEIAR TMQDMAGGAD EEAGATQRVA ENVEALTALA KDIAHLSSEG VNLVGEAKRR 
EEKGREVLKV LLANMERAAV SIEEAAEKVM RLEVKIEKVN EFVRYVTEIT DQTNLLALNA 
AIEAARAGDS GRGFAVVAGE VRKLAERSAQ AAQNIVRIAE TIQEVAKEAA KQVEENVRLV 
KDNLEQGEET MREMEEVTEA FTRVAGAMEE IYSNARKQAE RAQNINQDAS HMAAVAQETA 
AGVEEVTASV AHQEMAMETM EESVVKLSDM AGRFDELANQ YTKEGWDEAT KNSLIQNGMQ 
ILKSLAENSE IKSMQIEKLR KPFDEAVAGL DFIKYPMVVG LDGNIIYSPL KFNQSINWSF 
RPWFQAAIKG ESYIGKPYIT QATNRLAVPI SCPIKNEKGE VLGVLAANIA ED