Gene Moth_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1130
Symbol
ID	3833227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1157767
End bp	1159176
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	54%
IMG OID	637829059
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_429987
Protein GI	83589978
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTGC GTCTACGCCT CACCCTGCTG GTTACCATTA CCCTTGGTTT AACCTTCATT 
GTCCTGGGTG GACTGGTCTA TTTCCTGATG GGACATTACC TGACCAATGA AATTGATCGT 
TCCCTGGTCG CCCGGGCCCA GGAGGTTGTC CGTTCTTTTC GAGTAGAGGG AAACTTGCGC 
TTGCAGCGCA TTACGCTGCC CAATGTGAAT GTTTTCTCGG CTCCGGATAC CTTTATCCAG 
ATAGTTGATA TAAATGGTTT CGTAGTCACC CGTTCTGATA ATCTGGGTCA ACAATCTTTA 
CCCCTTGGAC CGCAAACCCT CATTCAAGCC GGGGAAGGCA TCGCCTTTTT TGAAACCGAG 
ATAGTCGGTA ACCATCCCCT GCGACTTTAT AATGTACCCC TTTTATTGCA AAACCAGCCG 
GTAGGGCTTC TCCAGGTAGC CCGCCTTCTC AGTCCCGTCC AGCAGACCCT GGGCAACCTG 
CGCCGGGTAC TGCTCTTCCT GGGGCTTTTA TTAATCTTCC TGGCTGCCAC CCTTGGTTAT 
ATCTTAGCCC GTACTGCCCT GCGGCCCATT GATCGTCTAA CCCAGGTGGC TGAACAAATA 
GGGGAGGGCA AGGATCTGGA TCAGCGGGTT CCCTACCAGG GCCCTATGGA TGAAGTCGGC 
CGGCTGGCTG CTACCTTTAA TGCTATGCTG GCCCGGCTTC AGCGAGCCTA CACCCGCCTG 
GAGGAAGCCT ATAGCGCCCA GCGGCGCTTC GTAGCCGACG CTTCCCATGA ACTGCGCACC 
CCCCTGACTA CCATCCGCGG TAATGTCGAC CTATTACGGA AAGTACAGGG TCAAGGGGAA 
GCATGGCAGG ATGAAGCCCT GGCCGATATT GCCAGTGAGG CCGAGCGAAT GAGCCGGCTG 
GTCAATGACC TCTTGACCCT TGCCCGGGCT GACGCCGGTC AGGAGATAAA ACGTGAACCA 
CTGGAAATAC TTCCTCTCTT ACAGGAGGTG GCCCGCCAAG CACCTTTATT GGGAACGGCC 
ACCTTCACAG CCATCGGATT GGAAAACCTG GCCGGAGTCC ACATCATGGG AAACCGGGAT 
TACCTCAAAC AGCTATTCTT TATCCTTCTG GATAACGCCT TTAAATATAC CCCTTCCGAA 
GGTAAAATCG ATTTAATAGT TAACGTTGAA CCCCAGCAGC GGTTGATCAT TAAAGTCAGG 
GATACCGGCC CGGGTATCCC TCCCCGGGAT CTGGAGCATA TTTTTGAACG GTTCTATCGC 
GCCGATGCTA CCCGCAGCAG TGAAGGAACC GGACTGGGCC TGGCCATAGC TCGGTGGATA 
GTTGAACAGC ACCAGGGTCA TATCGGGGTT GAAAGTACGG TGGGGAAGGG CACCACCTTC 
ACCATTACCA TCCCCCTGTT GAAAGGTTGA

Protein sequence

MTLRLRLTLL VTITLGLTFI VLGGLVYFLM GHYLTNEIDR SLVARAQEVV RSFRVEGNLR 
LQRITLPNVN VFSAPDTFIQ IVDINGFVVT RSDNLGQQSL PLGPQTLIQA GEGIAFFETE 
IVGNHPLRLY NVPLLLQNQP VGLLQVARLL SPVQQTLGNL RRVLLFLGLL LIFLAATLGY 
ILARTALRPI DRLTQVAEQI GEGKDLDQRV PYQGPMDEVG RLAATFNAML ARLQRAYTRL 
EEAYSAQRRF VADASHELRT PLTTIRGNVD LLRKVQGQGE AWQDEALADI ASEAERMSRL 
VNDLLTLARA DAGQEIKREP LEILPLLQEV ARQAPLLGTA TFTAIGLENL AGVHIMGNRD 
YLKQLFFILL DNAFKYTPSE GKIDLIVNVE PQQRLIIKVR DTGPGIPPRD LEHIFERFYR 
ADATRSSEGT GLGLAIARWI VEQHQGHIGV ESTVGKGTTF TITIPLLKG