Gene Moth_0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0022
Symbol
ID	3832110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	23270
End bp	24733
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	60%
IMG OID	637827949
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_428905
Protein GI	83588896
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000238684
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACCCGG CCCTCCACGC CCTTACCGAC CAGTACTGGT ACTGGTCCCT GTTTTTCTTC 
ATTTACGGCC TGTCCTTCTT CCTGATGGGC TTTGGCATCC TCATCCGTTC CAGGTGGGGA 
AGTAACCTCA GCCTGGGACG GCGGTTACCC TCCCTGGCCG TCTTTGGCCT GTTGCACGGG 
GCCACGGAAT GGGGTTATAT CTTCATTCCG GCCCGGGTGG TAGCCGAGGG CTGGCAAACC 
TTGCGGGGGG CCCTTTTAAC CGGCGGCCAT GCTTTACTTC TAGCCCTTTC CTATACCTTT 
CTCCTGGCCT TTGGCCTCAA CCTTATGGTC GATACCAGGA ACTGGCCCGG CTGGGTTAGA 
ACCCTGCCGG CAGTTTTCCT GGGTGGCTGG GGTCTGATTT TTTTCCTCAC CTTTCCCGGC 
GGCGGGGCAG CCACGGGGCC GTGGCTTGTT TCCGGAGACG TAACGGCCCG TTATTTACTG 
GCAGTACCGG GGTCGATCTT GAGCGCCCTG GCCATCCTGG CCCAGGTGGA GGAGCTGGCC 
CGGTTACGGC GCCGTTCCTT GAGGTTTTGC CTGATTGGCT CAGCTATGGC TTTATTCCTC 
TATACCTTTG CCGGTGGCCT GATGGTGCCG CCGGCGTCCT TCTTCCCGGC CAACGTCCTG 
AATACGGGCC TTCTAATGTC CCTTGGCCTG CCGGCCCCGG TCCTGCGCAT CCTCAGCAGC 
GTCCTGGTTG CCTACTTTAT CTTCCGCCTC CTGGAGGTTT ATGACGCCGA GGAGCAACGT 
TACCGGGAGA CAGTTAGGGA GCGGGAGATG ATCTGGCGGG AAAGGGAAAA GATTCGCCGG 
GATCTCCACG ACGGGGTTAT CCAGTCCATT TACGGCCTGG CCCTGGGCCT GGAGCATAGC 
CGCAACCTTC TCGCTGACAA CCCGGCGGCA GCAGCCGACA GGTTAAAGGT CTTGACCGGC 
CAGGCGGAAG GGATAATCAA CGACTTGCGG GGATACCTGG CCGGGTTGCA CCTGGGCCGG 
GAACTGCCGG CCGATCCGGT GGCCATTATC AAAGAACAGG TGATCAATCT GGCCCGGGGT 
ACAGAATTGG AGATCAAATG GCAAATTAAG GGGGCAGCCC AGGGCGGCCT GGATAGTGAA 
CAGCGGGACC ACCTCTACCA TATGGTGGCG GAGATCTGCA GTAATATCCG TCGCCATGCC 
CGGGCCAGCC GGGTCCGGGT CCAGGTGGAT CTAGGTGGGG AGGGTTTTAA GGTTACAATA 
AAAGATAACG GCACCGGCCT GTTGGGAACA GTGCCAGACC ACGGCCAGGG GTTAATCAAC 
CTGCGGCAGA GGGCGGCCCT GGCCGGGGGC TGGCTGGAAA TAGCAAGCTC ACCCGGTCGG 
GGCACGACGG TAACCTTCTG GTTGCCTTAC TCTATCGGCG GCGGGAGGGA AGGGGATGGC 
CATTCGCGTT ATGCTGGTCG ATGA

Protein sequence

MDPALHALTD QYWYWSLFFF IYGLSFFLMG FGILIRSRWG SNLSLGRRLP SLAVFGLLHG 
ATEWGYIFIP ARVVAEGWQT LRGALLTGGH ALLLALSYTF LLAFGLNLMV DTRNWPGWVR 
TLPAVFLGGW GLIFFLTFPG GGAATGPWLV SGDVTARYLL AVPGSILSAL AILAQVEELA 
RLRRRSLRFC LIGSAMALFL YTFAGGLMVP PASFFPANVL NTGLLMSLGL PAPVLRILSS 
VLVAYFIFRL LEVYDAEEQR YRETVREREM IWREREKIRR DLHDGVIQSI YGLALGLEHS 
RNLLADNPAA AADRLKVLTG QAEGIINDLR GYLAGLHLGR ELPADPVAII KEQVINLARG 
TELEIKWQIK GAAQGGLDSE QRDHLYHMVA EICSNIRRHA RASRVRVQVD LGGEGFKVTI 
KDNGTGLLGT VPDHGQGLIN LRQRAALAGG WLEIASSPGR GTTVTFWLPY SIGGGREGDG 
HSRYAGR