Gene Moth_1487 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1487
Symbol
ID	3832368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1533988
End bp	1535967
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	53%
IMG OID	637829419
Product	methyl-accepting chemotaxis sensory transducer
Protein accession	YP_430339
Protein GI	83590330
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00000879913
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTTA AAATCGCCGA TAGTATTAGC AGCCGGTTAC TAGCGCTGTT CCTTATTTTA 
TCCTTGATAC CAGCCATTAT TATCAGCCTG GTTAACTTTT ATTTCAGTAA GGCCCAATTT 
ACAGCTAACA CCTATTTGAC CCTAAGGCAA ATTACCACCA GTATGGCCGA AAATGTGAAC 
GATTGGATTA ACAGCCGTTT AACGCAAATG GATAAGGATG CAACTGCAAG TGTCCTGCAA 
TCAAATGATA AAGAGCAAAT TAGAGCTTTT GTAAAGATGG TAGCTGAGCA GACGGTTGAT 
GCCAATTTAG TTTTTTTTGC CGGGACTAAC GGTATGGTAA TTCCATCCAG CGGGCCAGAA 
GTCAATATTA GCGATAGGGA TTATTACCAG CAGGCCATCA AAGGCAAGGC CGCTATTTCC 
AATTTGGTTA TCAATAGAAG CACCGGCAAA GAGGGCATAA CCATAGCTGT ACCGGTTAAA 
GGGCCCGGGG GGATTATCGG TATACTGGGT ACCCATTATG ACAGCCAGAC ACTATTACAC 
CAGATAAACA ACAGCAAGTA CGGGCGGACG GGTTACGCCT ACATGCTCGA TAACACGGGC 
GTGGTCATGG CCCACCCGGA TGCTAAAAAA GTTTTGAACG AAAACCTGAC GAAAACTGAA 
TCCCAGAGCC TGAACAATGT CGCCCAGAAA ATGCTGCAAA ATAAAGAAGG AGAAGATGAG 
TATATCCGCA ATGGTGTCCG GAACCTGGTC GCCTATGCCC CGGTTAAAGC AACCGGCTGG 
GTAGTAGCCA TGACGGCCCC CACCAGTGAA GTATACGCCG GGGTCACTGC CATGCAACGT 
TTTAACATTA TCCTTATTAC CCTTGCTGCC ATCCTCATAG CCCTGCTGGC CTTTTATATC 
AGCCGAAAGA TAGCCAGGCC CATTATCACC CTGGCGGGGC AGGCCGATGT TTTAGCCACA 
GGCAACCTGC AGGTAGACAT TAACACCAAC TTCTACGGTG AGCTGGGGAC TTTAGGCCGA 
TCGTTAAAGA CTATGGTCAC CAACCTGCGG TCCATAGTCC AAAAAGTTCA GGATAGCGCC 
AACCAGATAG CCTCTTCCGC CCAGGAGTTC AGCGCCTCTA CGGAGGAAGC TTCCCGGTCG 
GTGGAGCAGG TGGCCAATGC CATTCAGGAT ATGGCCCGGG GCGCCAACGA CCAGGCTACC 
CAGTCCCAGA ATATAGCGGA ATTGGTCAAT AACATCACCG GTGCCATTGG CTCAACCAGG 
GACAGGGTAG AAGCCCTGGC CAGGTATTCG GAACAAACCG GGGAGCTGGT GGACGACGGC 
CTGGCGTCTA TGGAAAACCA GAACGACAAG ATGGCGGAAA ACCTGCAGGC AGCGCAAGCT 
GTCAGCGAAG CTATCAATAA GCTGGCCCGG GGGGCACGGG AGGTGGGTCA GATCCTGGAA 
ACAATCACCA GCATTGCCGA CCAGACCAAC CTGCTCGCCT TGAATGCGGC CATCGAGGCA 
GCCCGGGCCG GAGAACACGG GCGGGGTTTT GCCGTAGTCG CTGAAGAAGT GCGCAAACTG 
GCCGAAGGTT CGGCCCAGGC AGCGAGTGAG ATCGGCCAGA TTGTCCAGAA GATCCAGGAC 
GAGGCCCAGG GGGCGGTGGC AGAAATGGAT AAGGCTAAAG TCATTGTCGA CGCCCAGCAG 
GATGCCGTTA ATCATGCCAA CGAGGTATTC CAGAACATCT CTCAGAAGGT AAAGGCCATG 
GTCAAGGGCA TCGAAGAAAT AGCCGCCGCA ACGGAGCAGA TAAACAATGA GGCCCGGAAA 
ATTACGGAAG CTATCCAGGG GGTGTCGGCA ATAGCCGAGG AGAATGCGGC GGCAGCTGAA 
GAGATATCGG CCAGTACCGA AGAACAGAGC GCCACGGTGG AGGAAATCGC CGCCTCGGCC 
AATGCCCTGG CCAGCCTGGG GCAGGAACTG CAGCAGCTCA TTGCCCGATT TAAGCTGTGA

Protein sequence

MKLKIADSIS SRLLALFLIL SLIPAIIISL VNFYFSKAQF TANTYLTLRQ ITTSMAENVN 
DWINSRLTQM DKDATASVLQ SNDKEQIRAF VKMVAEQTVD ANLVFFAGTN GMVIPSSGPE 
VNISDRDYYQ QAIKGKAAIS NLVINRSTGK EGITIAVPVK GPGGIIGILG THYDSQTLLH 
QINNSKYGRT GYAYMLDNTG VVMAHPDAKK VLNENLTKTE SQSLNNVAQK MLQNKEGEDE 
YIRNGVRNLV AYAPVKATGW VVAMTAPTSE VYAGVTAMQR FNIILITLAA ILIALLAFYI 
SRKIARPIIT LAGQADVLAT GNLQVDINTN FYGELGTLGR SLKTMVTNLR SIVQKVQDSA 
NQIASSAQEF SASTEEASRS VEQVANAIQD MARGANDQAT QSQNIAELVN NITGAIGSTR 
DRVEALARYS EQTGELVDDG LASMENQNDK MAENLQAAQA VSEAINKLAR GAREVGQILE 
TITSIADQTN LLALNAAIEA ARAGEHGRGF AVVAEEVRKL AEGSAQAASE IGQIVQKIQD 
EAQGAVAEMD KAKVIVDAQQ DAVNHANEVF QNISQKVKAM VKGIEEIAAA TEQINNEARK 
ITEAIQGVSA IAEENAAAAE EISASTEEQS ATVEEIAASA NALASLGQEL QQLIARFKL