Gene Moth_0940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0940
Symbol
ID	3832941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	973428
End bp	974621
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	56%
IMG OID	637828870
Product	acetate kinase
Protein accession	YP_429799
Protein GI	83589790
COG category	[C] Energy production and conversion
COG ID	[COG0282] Acetate kinase
TIGRFAM ID	[TIGR00016] acetate kinase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000000914313
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAATCC TGGTCTTAAA CTGCGGCAGC TCATCGGTCA AATATCAGCT TTTTGATATG 
GAAGACGAGA GTGTTCTGGC TAAAGGACTG GTGGAAAGGA TTGGTATCGA CGGTTCCGTC 
CTGACCCATC GCCCGGCGGG CAAAGAAAAA CTGGTGCGTG AAACAGAAAT CCCCGATCAT 
AAAGTGGCTA TCCGCCTGTG CCTGGAAGCC CTGACCGACC CCCATTACGG GGTTATCAAA 
GACTACAGCG AAATCGGAGC CATCGGTCAT CGTATCGTCC ACGGTGGTAC TTTTCCCCAT 
TCGGTCCTGG TAGATGCCTC CACTAAAAAG GCCATTAGTG AACTGGAGGT TCTGGCACCC 
CTCCATAATG GCCCGGCCCT ACGGGGTATC GAGGCCTGTG AAGCCATCCT GCCCGGCACC 
CCCCAGGTAA CGGCTTTTGA TACGGCCTTT CACCAGGGTA TGCCGGATTA CGCCTATACT 
TACAGCCTGC CTTATGAACT CTGCCAGAAG CACCTCATTC GCCGCTACGG CGCTCACGGT 
ACCTCCCACC AGTATGTTGC CCTGCGGGCG GCGGCCATAG TTGGTAAGCC CCTGGAGGAA 
TTGAAGGTTA TTACCTGCCA CCTGGGTAAC GGCTCCAGTA TTACTGCTAT TAAAAACGCT 
AAATCATACG ACACCAGCAT GGGCTTCACC CCCCTGGCAG GTTTAACCAT GGGTACCCGT 
TGCGGTGATA TTGATCCGGC CATCGTACCC TTCCTGATGG AAAAAGAGGG CTATACCCCG 
GCGGAGATGG ACCAGGTGAT GAACCGCCGG TCAGGGGTCT TGGGAGTCTC CGGCCTCAGC 
AGCGACTTCC GGGATATTGA AGCCGCCATG GCTGAGGGTA ATGATCGCGC TCGCCTGGCC 
TGGGAGGTTT TCGTCCATAG CGCCAAAAAA TATATTGGCG CTTACGCTGC CCTTTTGAAC 
GGCCTGGATA TCTTGGTCTT TACAGCCGGC CTGGGGGAAA ACTCCATCGC CGCCCGGGAA 
GCCATATGCC GGGACATGGA CTACCTGGGT ATAAAGATTG ACCCCGAGAA AAACCAGGTC 
CGGGGCCAGG AAAGGGAGAT CACGGCCGCC GGAGCTAGGG TGCGCACCTT TGTTATCCCC 
ACCAATGAAG AATTAATGAT TGCTCGCGAT ACCCTGGCCC TCGTCCAGGC TTGA

Protein sequence

MKILVLNCGS SSVKYQLFDM EDESVLAKGL VERIGIDGSV LTHRPAGKEK LVRETEIPDH 
KVAIRLCLEA LTDPHYGVIK DYSEIGAIGH RIVHGGTFPH SVLVDASTKK AISELEVLAP 
LHNGPALRGI EACEAILPGT PQVTAFDTAF HQGMPDYAYT YSLPYELCQK HLIRRYGAHG 
TSHQYVALRA AAIVGKPLEE LKVITCHLGN GSSITAIKNA KSYDTSMGFT PLAGLTMGTR 
CGDIDPAIVP FLMEKEGYTP AEMDQVMNRR SGVLGVSGLS SDFRDIEAAM AEGNDRARLA 
WEVFVHSAKK YIGAYAALLN GLDILVFTAG LGENSIAARE AICRDMDYLG IKIDPEKNQV 
RGQEREITAA GARVRTFVIP TNEELMIARD TLALVQA