Gene Moth_0105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0105
Symbol
ID	3831995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	103373
End bp	105310
Gene Length	1938 bp
Protein Length	645 aa
Translation table	11
GC content	56%
IMG OID	637828039
Product	FtsH-2 peptidase
Protein accession	YP_428987
Protein GI	83588978
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0152057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACCGAA TTTTTAAGAA CCTGGCTATC TATCTTTTAA TAGTATTACT GGCGGTTTCC 
GTTATCAGGC TTTCCACACC GCCGGAGAAA CCAGCGCAGG AATGGGATCT CACCCGTTTC 
TATCAGGCCG TCGATCAGGA CCAGGTTCGG GAAGTAACCT TGACACCTCA GGACAACATT 
ATTAAAGTTG ACGGGGTCTT AAAGGACAAC ACCAAGTTTA CCGTTAATGC CCTGTCTTCA 
ACCCCGCTGA CGGACAGGTT AATCAGCAAA GGCGTCAGGA TCAAAACCCA GCCGTCACCC 
CAGCCGCCCT GGTGGACCAG CCTGCTGGGC AGCCTTTTAC CTATCCTCCT GCTGGTGGGG 
CTGGTCTTCT TTATGATGCA GCAGACCCAG GGTGGGGGTT CGCGGGTCAT GCAATTCGGC 
AAGAGCCGGG CCAGGTTGCA TACCGATGAT AAGCGGAAAG TCACGTTTGA AGATGTTGCC 
GGGGCCGATG AGGTCAAGGA AGAACTGGAG GAAGTCGTCG AGTTTCTGAA GAACCCGCGC 
AAATTTAATG AGCTGGGGGC CAGGATACCC AAAGGGGTTC TCCTTTTCGG CCCGCCAGGT 
ACAGGCAAAA CCTTGCTGGC CAGGGCTGTG GCCGGAGAAG CAGGGGTACC CTTTTTTAGT 
ATCAGCGGCT CTGACTTTGT AGAAATGTTC GTCGGTGTGG GCGCTTCCCG GGTGCGGGAT 
CTTTTTGAAC AGGCCAAGAA AAATTCGCCC TGTATCGTTT TTATTGACGA GATTGATGCC 
GTCGGCCGCC AGCGAGGTGC CGGCCTGGGC GGCGGCCACG ATGAGCGCGA GCAGACCCTG 
AACCAGCTGC TGGTAGAGAT GGACGGTTTT AATGCCAATG AAGGCATTAT CATTATTGCC 
GCCACCAACC GGCCGGATAT CCTGGACCCG GCCCTGCTAC GCCCGGGCCG TTTTGACCGC 
CAGATTGTAG TTGATATACC TGATGTCAAC GGCAGGAAGG ATATTTTAAA GGTGCATGTC 
CGGGGGAAAC CCCTTGATGA AACCGTTGAC CTGGACGTCC TTGCCCGCCG TACCCCTGGC 
TTCACCGGTG CCGACCTGGC CAACCTGGTC AATGAGGCGG CCCTCCTGGC AGCCAGGCGC 
GGTAAACATA AAATCAGTAT GGAAGAAATG GAGGACTCTA TCGAACGGGT CATCGCCGGG 
CCTGAGAAAA AGTCCCGGGT CATCAGCGAC TACGAGAAAA GGCTGGTGGC CTTCCACGAA 
GCGGGCCATG CCCTGCTGGG GCATTATTTA CCCCATACGG ATCCCCTCCA CAAAGTATCC 
ATTATTCCCC GGGGCAGGGC CGGCGGTTAT ACCCTGCTTT TGCCCAAGGA AGACCGTCGC 
TATATGACCA AATCCCAGAT TATCGACCAG GTCACCATGC TCCTGGGTGG GCGGGTTGCC 
GAGGCCCTGG TTCTTAAAGA GATCAGCACC GGTGCCCAGA ACGACCTGGA ACGGGCCACC 
GAGCTGGTTC GTAAGATGAT CACCGAGTTC GGCATGTCGG AGGAACTGGG CCCTCTGACC 
TTCGGACGCA GGCAGGAAAC CGTCTTCCTG GGCCGGGATA TCGCCCGGGA TCGCAATTAT 
AGCGAGGCTG TAGCCTTTTC CATCGACAAA GAAGCCCGGC ACATCATCGA TGAGTGTTAT 
AACCGGGCAA AGGAAATGCT CCAGAAGCAC CTGGCGGAAT TGCACCTGGT GGCCAGGGCG 
TTGATGGAAA AAGAAACCCT GGAAGCCGAG GAGTTTACGG CTATTATCGA GGCTTATGAC 
CGGGAACACG GGGTTCCTGA GAATTCTTCC GACGCCGGGA AACCGGCAGC TGCCGGCGGC 
CAGGATACGG GAAAAGATAC CCCCGGGAAT ACTCTTATTA AGTTAACCTT CCTGCAGGGC 
CTGAAAGGGG TATGGTAG

Protein sequence

MNRIFKNLAI YLLIVLLAVS VIRLSTPPEK PAQEWDLTRF YQAVDQDQVR EVTLTPQDNI 
IKVDGVLKDN TKFTVNALSS TPLTDRLISK GVRIKTQPSP QPPWWTSLLG SLLPILLLVG 
LVFFMMQQTQ GGGSRVMQFG KSRARLHTDD KRKVTFEDVA GADEVKEELE EVVEFLKNPR 
KFNELGARIP KGVLLFGPPG TGKTLLARAV AGEAGVPFFS ISGSDFVEMF VGVGASRVRD 
LFEQAKKNSP CIVFIDEIDA VGRQRGAGLG GGHDEREQTL NQLLVEMDGF NANEGIIIIA 
ATNRPDILDP ALLRPGRFDR QIVVDIPDVN GRKDILKVHV RGKPLDETVD LDVLARRTPG 
FTGADLANLV NEAALLAARR GKHKISMEEM EDSIERVIAG PEKKSRVISD YEKRLVAFHE 
AGHALLGHYL PHTDPLHKVS IIPRGRAGGY TLLLPKEDRR YMTKSQIIDQ VTMLLGGRVA 
EALVLKEIST GAQNDLERAT ELVRKMITEF GMSEELGPLT FGRRQETVFL GRDIARDRNY 
SEAVAFSIDK EARHIIDECY NRAKEMLQKH LAELHLVARA LMEKETLEAE EFTAIIEAYD 
REHGVPENSS DAGKPAAAGG QDTGKDTPGN TLIKLTFLQG LKGVW