Gene Moth_2494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2494
Symbol
ID	3831597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2599308
End bp	2600777
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	55%
IMG OID	637830416
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_431319
Protein GI	83591310
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box [TIGR02966] phosphate regulon sensor kinase PhoR

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.228009
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTCAC TACGCTGGAA GATTACCCTA AACTTTTTGA CCCTCCTTTT CTTCACTCTG 
TTGGGGGCCT ATCTCTACTT ACACCAGGCT ATCTTGAAGG CCATGGGATT ACCATGGTTA 
CCCCCCTTCC GGGCCGGGTT CCTGGCTGCC AGGTTAGAGG GACAACTGCT GGCCGTCATG 
ATCCTAGTTT TGATTATAAT GGGCATTGGC ACCTTTATCC TGGCCCGGGG GATTATAACC 
CCCCTGACGG CCCTCCTGCC CCTGACCCGC AGGATTGCCG CCGGTGACCT GGAACAGCGG 
GTAGAGATCC AGAGTGACGA TGAGGTGGGT TTATTAAGCC ATCATCTAAA TATCATGGTG 
GAAACTCTAC GCAATAATTT CCGGGAAATA GCAGACGAGC GCAATAAAAT GAAGGCTATC 
CTGGCCAGTA TAACCGACGG CCTGGTAGCT GTTGACCAGG TGGGCCGGGT TATAATGCTC 
AATCCGGCGG CAGAGAAGAT GTTCGGTAAA AAGGGGGCAG AGGTCGAGCA CAAGTATCTC 
CTCAAGGTTG TCCGTAACCA TGAAATCGAT GCCATGGTAA AGGAGATCCT GGCCAGTGGC 
CTGCCCCTGG AGAATGAGGT CCGGCTCTTC CCGACTACCA GTCAGTTATT CAGAATCTAT 
GGTACGCCCA TCACCAGCGA ACAGGGACGA ATAATCGGGG CCGTGCTCAC CATCCGGGAT 
ATTACCGACA TCCGCCGCCT GGAGCAGATG CGGACGGAGT TTGTGGCCAA CGTCTCCCAT 
GAATTACGTA CCCCCCTGAC CTCAATCCGG GGCTTTGTTG AGACTCTGCT GGAGGGGGCC 
CTTGAAGACC CGGAGGTCAG CCGGCGCTTC CTGGGAATTA TCAACCATGA AGCCCAGCGA 
TTGCAGCAAT TAATCGAAGA CCTTCTCTCC CTGTCACGAC TGGAGAGCCA ACCAAAGCGA 
CAGGATGCTG GGCGTGCGGA CCTGGCGGCC ACCTTGGACC GGGTCCTCAC TACTGTTAAC 
CAGTTAGCAA GGGAGAAAGG AGTCGCCCTG GAGAAGGAGA TACCGGCGGA GATACCGGAG 
TTGGCCATCA GTGAGAGCTA TCTGAACCAA GTGCTCCTTA ATCTGATTGA TAATGGCATT 
AAGTATACCC CCGCCGGTGG CAGGGTAACT ATACGTGCTG CCCGGTTAGG GGAATTAGTT 
CAGGTAGAGG TGGCAGATAC CGGCATAGGC ATCCCCCCCG AGAGCCTTCC CCGCGTATTT 
GAACGATTCT ACCGGGTAGA TAAGGCGCGT TCCCGGGAGA TGGGAGGCAC CGGTCTGGGC 
CTGGCTATCG TCAAGCATAT AGTCGAGTCC CATGGTGGCA GTATCAGTGT GACCAGCAGG 
CCGGGCCAGG GCAGCCATTT CTTCTTTACC CTCCCCATTG CCGCTGAGGA AGGGGGGCGA 
AGCAATTACC AGGAAGAACC GGGCACCTGA

Protein sequence

MHSLRWKITL NFLTLLFFTL LGAYLYLHQA ILKAMGLPWL PPFRAGFLAA RLEGQLLAVM 
ILVLIIMGIG TFILARGIIT PLTALLPLTR RIAAGDLEQR VEIQSDDEVG LLSHHLNIMV 
ETLRNNFREI ADERNKMKAI LASITDGLVA VDQVGRVIML NPAAEKMFGK KGAEVEHKYL 
LKVVRNHEID AMVKEILASG LPLENEVRLF PTTSQLFRIY GTPITSEQGR IIGAVLTIRD 
ITDIRRLEQM RTEFVANVSH ELRTPLTSIR GFVETLLEGA LEDPEVSRRF LGIINHEAQR 
LQQLIEDLLS LSRLESQPKR QDAGRADLAA TLDRVLTTVN QLAREKGVAL EKEIPAEIPE 
LAISESYLNQ VLLNLIDNGI KYTPAGGRVT IRAARLGELV QVEVADTGIG IPPESLPRVF 
ERFYRVDKAR SREMGGTGLG LAIVKHIVES HGGSISVTSR PGQGSHFFFT LPIAAEEGGR 
SNYQEEPGT