Gene Moth_1477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1477
Symbol
ID	3832358
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1524852
End bp	1526231
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	60%
IMG OID	637829410
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_430330
Protein GI	83590321
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID	[TIGR01386] heavy metal sensor kinase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000762888
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGGCAGA AATTTTCCAC CTGGCTCCGC GGTATTCCCC TGCGGTGGCG GCTGACGGCC 
TGGTATGTTT TCTTGCTGGC CTTGATCCTG GCCGGCTTCA GCGCTTTTAT TTACTTTAAC 
ATGTCCCGGA GCCTGAAACA GGGCCTGGAT TCTTTATTAT TCTCCCAGGG GGAACAGGTT 
TTAAGCAGCC TGGACAACGA GAACGGCCTG CCACGCCTGG ACCCCAATTT GCCCCTCCTG 
CCCGGTACTT ACTTTGGCCT TTACGACACC GGAGGTAAAG TCCTGGATAC AAACATGCCG 
GCGGACCTGG CTACCGGCTT CCAGGTGAAG GGCTTAACGG CCAGCCGGCC CGCAACAGTG 
GAGATTAAGG GGGCCGAATG GCGGGTGCTC CTGGTCCCGG TAAGGGAAAA AGGCCAGCAA 
CCTTACTGGG TCCTGGTTGT ACGCTCGGTC GAAGAGACCG AAAAGCCCCT GGACCGCCTG 
CTGTTATTTA TCCTTATTGC CATCCCCATG ACCCTGCTGG TGGCGGCGGG AGGGGGTATT 
TTCCTGGCCC GGCGGGCGTT GCAGCCTATT GATAGAATTG CCGCCAAAGC CCGCCAGATC 
AGCGCTACTG ACCTGAGCCG GCGCCTGGAC CTGCCCCACG GTAACGACGA GGTGGGGCAC 
CTGGTGGCCA CCCTGGACGA GATGCTGGAT CGCCTGGACC GGGCCTTTCA GCGCCAGCGG 
CAGTTTACTG CCGACGCCTC CCACGAATTT CGCACCCCCC TGGCCGTCAT CCGCAGCCAG 
GCCGAAGCGG CCCTACAGCG GCAGCACTCG CCGGCAGAGT ACCGCCAGGC CCTGGAAATA 
ATCCGTGATC AGGCGGAGTG GATGGGTAAC CTGGTCGCCA AGTTATTGCT TTTGGCCCGG 
AGCGACGACA GGATGGAACA GATGGAGATG GAACCCCTGG ATTTGGGCGA ACTGGTGGAA 
GGCGTCACGG CCGAATTCCA GGGGATGGCG GCGGAAAAGG GCCTGAGGCT GGTAAAAAAA 
ATTAAGGAAA AAGTGGTCGT TCGCGGGGAT CAGACACGCT TGACCCAGCT CCTGGCCAAT 
CTGGTGGATA ATGCCATCAA ATATACGCCG GAAGGGGAGG TGGTCGTCAG CCTGGAACGG 
CGCGGCCGGC AGGCCCTGCT GCAGGTGCAG GATACGGGAG TAGGTATCCC GGAGGAACAT 
CTGGCCCATA TCTTTGAGCG ATTCTACCGG GTCGATAAAG CCCGTTCCCG GGCGGAAGGG 
GGCTTTGGCC TGGGACTGGC TATCTGCGAC TGGATCGTCC GCGCCCATAA CGGCAAAATT 
GAGGTAGAAA GTGCGGTGGG GCGGGGAACA ACCTTTAAAG TATGGTTGCC GGTTGAATGA

Protein sequence

MRQKFSTWLR GIPLRWRLTA WYVFLLALIL AGFSAFIYFN MSRSLKQGLD SLLFSQGEQV 
LSSLDNENGL PRLDPNLPLL PGTYFGLYDT GGKVLDTNMP ADLATGFQVK GLTASRPATV 
EIKGAEWRVL LVPVREKGQQ PYWVLVVRSV EETEKPLDRL LLFILIAIPM TLLVAAGGGI 
FLARRALQPI DRIAAKARQI SATDLSRRLD LPHGNDEVGH LVATLDEMLD RLDRAFQRQR 
QFTADASHEF RTPLAVIRSQ AEAALQRQHS PAEYRQALEI IRDQAEWMGN LVAKLLLLAR 
SDDRMEQMEM EPLDLGELVE GVTAEFQGMA AEKGLRLVKK IKEKVVVRGD QTRLTQLLAN 
LVDNAIKYTP EGEVVVSLER RGRQALLQVQ DTGVGIPEEH LAHIFERFYR VDKARSRAEG 
GFGLGLAICD WIVRAHNGKI EVESAVGRGT TFKVWLPVE