Gene Moth_0974 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0974
Symbol
ID	3831250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1003286
End bp	1004440
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	56%
IMG OID	637828903
Product	histidine kinase
Protein accession	YP_429832
Protein GI	83589823
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.103866
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCAGAAA AGGTAATAAC TGCTGCCACC CTGGAGCAAA TAGTAAAGGA AACAGTTAAA 
ACCCTGGAGG AGAGCCGGGA AGCCATTTAC AACATCGCTG AAACGGCCCG GCAGGAAGAG 
GCCCGGCTGC GCCAGGAGCT GGATGAGGTC CGCCGGGAAT TCAGTGAGGC TGCAGCCCGG 
GTGGACAGGC TGGAAATAGA AGAAAAGAAG GCCAGGAACC GTTTGATGGA AGTAAGCCGT 
GACTTTTCCA GCTACGGGGA AAAGGAGATG CAGGCGGCCT ACGAACGAGC CCGGGAGTAC 
CAGGTCCAGC TGGGTTTGTG GCGGGAACGG GAGAGCCAGC TGCGCCTGCG CCGGGACCGC 
CTGGAAAGTA CCTTGAAAAA CCAGCAGGAG ATGGTCCGGC GGGCGGAAGA ACTGGTGCGG 
AATGTTGGTG CTGCCCTGGC CTTGTTGACC GGAGAACTGG CCCGGGTGGG CGATCACCTG 
GAGGAACTGG AACAGCGCCA CCTGGTAGGA TTAAAGATTC TCCAGGCCCA GGAAGAGGAA 
CGCCGGCGCC TGGCCCGGGA GATTCACGAT GGGCCGGCCC AGGCTATGGC CGGGATAGCC 
TTTAAAGCCG AACTCTGTAC CAGGCTGGCT GATATTAAAT CAGGTAATTT AAAGAACGAA 
CTCCTGGCCC TGGGTAATCT GGCCCGGGAT ACCCTGGCAG AAATACGGAA AATAATCTTT 
TCCCTGCGGC CGATGATGCT TGACGACCTG GGATTGGTAC CGGCCCTTTA TCGTTTTGCA 
GGCGAATACC TGGAAAAATA CGGCCTGGAT GTAGAATTAA TTATCATTGG CAATGAGGAA 
CGATTGGATA AAGCCCTTGA AATAGGCATC TTTCGTCTAA TTCAAGAGGC TTTAAATAAT 
GTCTGGAAGC ATGCCGGGGT AACCGAGGCC CGGGTTAAGG TGGAGTTCCG ACCTGAGAAA 
ATCACCCTGA GTATCAAAGA TGAGGGTTGC GGCTTTGATC CGGCAGCAGC CCGGGGGAGC 
GGGTACGGCC TGGCCGGTAT GCAGGAGCGA GTGAAACTCC TGGGCGGAAA GCTGGCAATT 
AAAACTGCCC CGGGCCGGGG TACGGAGGTA GAAATAGTTA TCCCGCGGCA GCAAGGAGGG 
GGGTGGGGAT TTTGA

Protein sequence

MPEKVITAAT LEQIVKETVK TLEESREAIY NIAETARQEE ARLRQELDEV RREFSEAAAR 
VDRLEIEEKK ARNRLMEVSR DFSSYGEKEM QAAYERAREY QVQLGLWRER ESQLRLRRDR 
LESTLKNQQE MVRRAEELVR NVGAALALLT GELARVGDHL EELEQRHLVG LKILQAQEEE 
RRRLAREIHD GPAQAMAGIA FKAELCTRLA DIKSGNLKNE LLALGNLARD TLAEIRKIIF 
SLRPMMLDDL GLVPALYRFA GEYLEKYGLD VELIIIGNEE RLDKALEIGI FRLIQEALNN 
VWKHAGVTEA RVKVEFRPEK ITLSIKDEGC GFDPAAARGS GYGLAGMQER VKLLGGKLAI 
KTAPGRGTEV EIVIPRQQGG GWGF