Gene Moth_1205 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1205
Symbol
ID	3832972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1243512
End bp	1244834
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	49%
IMG OID	637829138
Product	AraC family transcriptional regulator
Protein accession	YP_430062
Protein GI	83590053
COG category	[T] Signal transduction mechanisms
COG ID	[COG4753] Response regulator containing CheY-like receiver domain and AraC-type DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.909691
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGCGC TAAGTTTGAG CGAAAGAATG GAAGACCTCC AAATAAAAAA GAAGATGGAA 
AAGGAGCTTT TCCAGAGGTT GTTAAACTCT TTTTCTTACG CTACGAGGAT GTTTTCCGCC 
ATAACAGATT TGGAAGGAAA TTGCATACTC TCCTCCGAGC AGGGTGATTG CGAGTTCTGC 
CAGCTGGTCA AATCGAGTCC TACCGGAATG GCCCGTTGCC GGAGTTCTTA TGCCTGGGCC 
GGGGAGCAAG CCCTCAAATG GAAAGAGCCT TATATTTTCA AATGCCATGC CGGCCTTATC 
TCATGGGTCT GCCCCTTTTT CTACAGGGGC AAGCACATCG GGAATTTTAT TTGCGGCCAG 
GTAATGATGT GGCAGCCCGC CGAATTCTGT CATCACTGGA TCAGGGAACT GGCGTCTGAG 
ATAGAGCAGG ACCCCAACAT TTTGTTACAA TCCGTAGACA GGGTTAAGTC GGTGTCGTCG 
GTAGAGATCC AGGCCGCGGC CGATCTGGTC TTTATCATTA CCAGTTACGT AGCAAAGAGC 
GAGGGAGAGA TCTTTGACTT CCAGCAAAAA TTGCGAAGAG TCGGTTCCTG GATATGGACG 
GAAAACAAGA AACAGAAGGA TGTCGGGAGC CAGACCGCCG GGGGCAACAC AGAGCAGGAC 
CTGAGCAAGA TAGGGAACCA GATCTTTATG GAGATCAGGA GATCAGATAT CGATAAGGCA 
AAAAAGCTGC TAGAGCAGCT CGTCCTGCAG ATTTTTATCC AGAGCAAGGG GCAATTGGAA 
GTTATCAAGG GGCGCAGCCT GGAACTCCTG AGCTTCCTTA TCCGTACGTC GACCGAATAC 
GGAGTAAAGT TCGGGGAAGT AATCCACTTA AGCGATCTGA AGCTGAGGGA GATAGACGAG 
GCTGACACCG TAGAAAAGGC TGTCCTCTGG CTTCTGGCGG TGGGAAACGC CTTTATCGAG 
TTGATTGCGG AAAGGAATTC CAGCGAGGGA GAGGGCATAA TCGACAGAGT TGTCGAATAT 
ATCCAGAAAA ACTATAGTTC GGAGAGCCTC TCTGTTAAAG AAATTGCCAG AGCCAGCTAC 
CTGAGCCCGG CATATCTGGG GCAACTGTTC AAAAAAAAGA TGGGCTATTC CCTCACCGAG 
CACATTAACA AGGTGAGGAT CGAGCAGGCG AAGCTCTTGC TCAGGCAAAC CGAACAGACC 
ATTGAGTCGG TAGCTATACA GACGGGTTTT AAAGAGCGCA GTTATTTCTG CAAGGTTTTT 
AAAAAAATTA CCGGCTTGAG TCCTAACGAG TATAGGAGAA AGAATTTCTC TCCATTGGTC 
TGA

Protein sequence

MLALSLSERM EDLQIKKKME KELFQRLLNS FSYATRMFSA ITDLEGNCIL SSEQGDCEFC 
QLVKSSPTGM ARCRSSYAWA GEQALKWKEP YIFKCHAGLI SWVCPFFYRG KHIGNFICGQ 
VMMWQPAEFC HHWIRELASE IEQDPNILLQ SVDRVKSVSS VEIQAAADLV FIITSYVAKS 
EGEIFDFQQK LRRVGSWIWT ENKKQKDVGS QTAGGNTEQD LSKIGNQIFM EIRRSDIDKA 
KKLLEQLVLQ IFIQSKGQLE VIKGRSLELL SFLIRTSTEY GVKFGEVIHL SDLKLREIDE 
ADTVEKAVLW LLAVGNAFIE LIAERNSSEG EGIIDRVVEY IQKNYSSESL SVKEIARASY 
LSPAYLGQLF KKKMGYSLTE HINKVRIEQA KLLLRQTEQT IESVAIQTGF KERSYFCKVF 
KKITGLSPNE YRRKNFSPLV